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自古 以 来 ， 人 类 一 直 幻 想 着 能 够 制造 出 具有 智能 的 机 器 ， 很 多 美丽 的 传说 都 蕴含 着 这 样 
的 思想 。 随 着 计算 机 技术 的 出 现 和 发 展 ， 这 种 幻想 终于 逐渐 得 以 实现 。 

从 1956 年 的 达 特 茅 斯 会 议 开 始 ， 人 工 智 能 历经 60 多 年 的 坎坷 发 展 ， 终 于 成 为 目前 相对 
比较 完善 的 学 科 ， 无 数 的 科技 工作 者 为 人 工 智能 的 发 展 做 出 了 大 量 不 可 磨灭 的 贡献 。 在 此 ， 
我 们 怀 着 崇敬 的 心情 对 人 工 智 能 的 先驱 者 们 表示 由 衷 的 敬佩 。 

人 工 智能 是 一 门 涉及 认 知 科学 、 神 经 生物 学 、 心 理学 、 计 算 机 科学 、 数 学 、 信 息 与 控制 
科学 等 诸多 学 科 的 交叉 性 、 前 沿 性 学 科 。 其 研究 内 容 包括 知识 工程 、 专 家 系统 、 机 器 学 习 、 
神经 网 络 、 模 式 识别 、 优 化 计算 等 多 个 应 用 领域 ,受到 国内 外 研究 学 者 的 普遍 重视 。 尤 其 是 
最 近 十 年 来 ， 人 工 智能 的 成 果 大 量 地 应 用 到 人 们 的 生活 中 ， 人 工 智能 的 神秘 面纱 也 逐渐 被 大 
众 揭 开 。 

AlphaGo 的 出 现 ， 促 使 深度 学 习 、 神 经 网 络 等 人 工 智能 专业 词汇 在 大 众人 群 中 得 到 了 普 
及 。 大 量 的 人 工 智能 技术 及 产品 也 随 之 涌现 出 来 ， 人 们 突然 意识 到 人 工 智能 的 快速 崛起 。 

从 2015 年 开始 ， 我 国 积极 鼓励 、 推 动 和 支持 人 工 智能 技术 的 发 展 ， 并 大 力 推动 机 器 人 
技术 的 发 展 。2015 年 5 月 20 日 ， 国 务 院 印 发 《中 国 制 造 2025》， 部 署 全 面 推进 实施 制造 强 
国 战略 。“ 智 能 制造 ”被 定位 为 中 国 制造 的 主攻 方向 。2015 年 7 月 5 日 ， 国 务 院 印发 《“ 互 
联网 +” 行 动 指导 意见 》， 提 出 大 力 发 展 智能 制造 。 以 智能 工厂 为 发 展 方向 ， 开 展 智能 制造 
试点 示范 ， 加 快 推动 云 计算 、 物 联网 、 智 能 工业 机 器 人 、 智 能 制造 等 技术 在 生产 过 程 中 的 应 
用 ， 推 进 生 产 装备 智能 化 升级 、 工 艺 流 程 改 造 和 基础 数据 共享 ， 着 力 在 工控 系统 、 智 能 感知 
元 需 件 、 工 业 云 平台 、 操 作 系 统 和 工业 软件 等 核心 环节 取得 突破 ， 加 强 工业 大 数据 的 开发 与 
利用 ， 有 效 支 撑 制造 业 智能 化 转型 ， 构 建 开放 、 共 享 、 协 作 的 智能 制造 产业 生态 。2016 年 4 
月 ， 工 信和 部、 国家 发 改 委 、 财 政 部 联合 发 布 《 机 器 人 产业 发 展 规 划 (2016 一 2020 年 )》， 为 
“十 三 五 ”期 间 我 国 机 器 人 产业 发 展 描绘 了 清晰 的 蓝图 。2016 年 5 月 23 日 ， 发改委 、 科 技 
部 、 工 信和 部 和 网 信 办 联合 印发 《“ 互 联网 +” 人工 智能 三 年 行动 实施 方案 》。 方 案 中 指出 ， 到 
2018 年 ， 中 国 将 基本 建立 人 工 智 能 产业 体系 、 创 新 服务 体系 和 标准 化 体系 ， 培 育 若干 全 球 
领先 的 人 工 智 能 骨干 企业 ， 形 成 千 亿 级 的 人 工 智 能 市 场 应 用 规模 。 方 案 提 出 ， 为 降低 人 工 智 
能 创新 成 本 ， 中 国 将 建设 面向 社会 开放 的 文献 、 语 音 、 图 像 、 视 频 、 地 图 及 行业 应 用 数据 等 
多 类 型 人 工 智 能 海量 训练 资源 库 和 标准 测试 数据 集 。 国 家 还 将 建设 满足 深度 学 习 等 智能 计算 
需求 的 基础 资源 服务 平台 ， 包 括 新 型 计算 集群 共享 平台 、 云 端 智 能 分 析 处 理 服务 平台 、 算 法 
与 技术 开放 平台 等 2016 年 7 月 28 日 ， 国 务 院 印发 《“ 十 三 五 ”国家 科技 创新 规划 》。 该 规 
划 在 “新 一 代 信 息 技术 ”中 提 到 人 工 智能 : 重点 发 展 大 数据 驱动 的 类 人 智能 技术 方法 ; 突 
破 以 人 为 中 心 的 人 机 物 融 合理 论 方法 和 关键 技术 ， 研 制 相 关 设 备 、 工 具 和 平台 ; 在 基于 大 数 
据 分 析 的 类 人 智能 方向 取得 重要 突破 ， 实 现 类 人 视觉 、 类 人 听觉、 类 人 语言 和 类 人 思维 ， 文 
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3》 人 工 智能 技术 





撑 智 能 产业 的 发 展 。2016 年 9 月 1 日 ,《 国 家 发 展 改 革 委 办 公 厅 关于 请 组 织 申报 “互联 网 +” 
领域 创新 能 力 建设 专项 的 通知 》 出台 ， 其 中 提 到 了 人 工 智 能 的 发 展 应 用 问题 。 为 构建 “ 互 
联网 +” 和 领域 创新 网 络 ， 促 进 人 工 智能 技术 的 发 展 ， 应 将 人 工 智 能 技术 纳入 专项 建设 内 容 。 
2016 年 12 月 19 日 ,国务院 印发 《“ 十 三 五 ”国家 战略 性 新 兴 产 业 发 展 规划 》 的 通知 ， 要 求 
发 展 人 工 智能 ， 培 育 人 工 智 能 产业 生态 ， 促 进入 工 智能 在 经 济 社会 重点 领域 推广 应 用 ， 打 造 
国际 领先 的 技术 体系 。2017 年 3 月 “人 工 智能 ”首次 写 人 政府 工作 报告 。2017 年 7 月 ， 国 
务 院 印 发 《新 一 代 人 工 智 能 发 展 规 划 》 的 通知 ， 指 出 发 展 人 工 智 能 是 一 项 事 关 全 局 的 复杂 
系统 工程 ， 要 按照 “构建 一 个 体系 、 把 握 双 重 属性 、 坚 持 三 位 一 体 、 强 化 四 大 支撑 ”进行 
布局 ， 形 成 人 工 智 能 健康 持续 发 展 的 战略 路 径 。2017 年 10 月 ， 人 工 智能 写 入 十 九 大 报告 。 
2017 年 12 月 13 日 ， 工 信和 部 印发 《促进 新 一 代 人 工 智 能 产业 发 展 三 年 行动 计划 (2018 一 
2020 年 ) 》， 明 确 了 人 工 智能 2018 一 2020 年 在 推动 战略 性 新 兴 产 业 总 体 突破 、 推 进 供给 侧 
结构 性 改革 、 振 兴 实 体 经 济 、 建 设 制 造 强国 和 网 络 强 国 方面 的 重大 作用 和 具体 目标 。 

国家 政策 的 强 有 力 支 持 ， 促 进 了 人 工 智 能 产业 的 迅速 发 展 。 人 工 智能 技术 发 展 速 度 之 快 
令 人 惊讶 ， 新 的 研究 内 容 以 及 理论 方法 更 新 之 快 令 人 日 不 暇 接 。 

本 书 内 容 兼 顾 人 工 智能 的 经 典 知 识 和 前 沿 技 术 ， 着 重 于 基本 理论 与 实际 应 用 相 结 合 ， 强 
调 内 容 的 新 疾 性 、 先 进 性 、 实 用 性 和 可 读 性 。 特 别 注重 算法 的 编程 实现 和 实际 问题 的 分 析 与 
解决 。 为 易于 读者 理解 相关 的 理论 知识 ， 书 中 简化 了 相关 理论 证 明 ， 并 给 出 了 实际 的 应 用 案 
例 分析 ， 增 加 了 学 习 的 趣味 性 和 直观 性 。 

本 书 注重 培养 与 训练 学 生 的 创新 思维 。 在 介绍 完 一 个 基本 算法 后 ， 会 给 出 一 系列 在 其 基 
础 上 的 改进 算法 ， 一 方面 可 加 次 学 生 对 基本 算法 的 理解 ， 另 一 方面 可 培养 学 生 独 立 思考 与 分 
析 算 法 性 能 的 能 力 ， 有 利于 学 生 寻 找 创新 点 ， 训 练 学生 的 创新 思维 。 

考虑 到 现 有 的 人 工 智能 类 书籍 大 多 是 针对 计算 机 应 用 专业 编写 的 ， 因 此 本 书 在 选材 方面 
适当 加 入 了 智能 控制 等 方面 的 知识 ， 可 以 满足 自动 化 专业 的 教学 要 求 。 同 时 结合 作者 的 研究 
经 历 并 参考 相关 文献 ， 增 加 了 一 些 人 工 智 能 领域 的 最 新 研究 成 果 ， 丰 富 了 本 书 的 内 容 。 

本 书 共 分 为 10 章 ,， 第 1 章 简 述 人 工 智 能 的 发 展 历史 、 基 本 流派 、 研 究 领域 ， 第 2 章 介 
绍 多 种 知识 表示 方法 和 推理 技术 ; 第 3 章 介绍 图 搜索 技术 ; 第 4 章 介 绍 专家 系统 的 理论 知识 
以 及 开发 工具 的 使 用 和 设计 方法 ; 第 5 章 介 绍 模糊 理论 的 基本 知识 以 及 模糊 理论 在 控制 和 模 
式 识别 等 方面 的 应 用 ; 第 6 章 介绍 机 器 学 习 的 基础 理论 知识 ， 重 点 介绍 多 种 神经 网 络 的 学 习 
理论 和 应 用 方法 ; 第 7 章 介 绍 卷 积 神经 网 络 的 原理 及 TensorFlow 的 应 用 ; 第 8 章 介绍 混沌 的 
初步 理论 知识 ， 并 介绍 混沌 神经 网 络 的 相关 内 容 ; 第 9 章 介 绍 多 种 智能 优化 算法 的 原理 和 实 
际 应 用 ; 第 10 章 介 绍 智能 体 与 多 智能 体系 统 的 相关 知识 及 应 用 。 

本 书 由 修 春 波 主编 并 统 稿 ， 卢 少 舌 、 苏 雪 苗 、 乔 博 、 王 雅 君 、 夏 琳 琳 、 张 继 德 、 成 怡 、 
陈 奕 梅 、 田 翘 欣 、 李 金 义 、 王 若 思 、 潘 肖 楠 等 多 位 老师 参与 了 本 书 的 编写 工作 。 本 书 由 北京 
理工 大 学 张 宇 河 教授 主 审 。 

由 于 编者 能 力 和 水 平 有 限 ， 书 中 不 受 与 错误 之 处 在 所 难免 ， 奶 请 各 位 专家 和 读者 不 音 指 
导 和 帮助 。 对 此 ， 我 们 深 表 感谢 。 
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人 工 智能 (Artificial intelligence，AI) 是 指 研究 如 何 用 计算 机 去 模拟 、 延 伸 和 扩展 人 的 
智能 ， 如 何 使 计算 机 变 得 更 聪敏 、 更 能 干 ， 如 何 设计 和 制造 具有 更 高 智能 水 平 的 计算 机 的 理 
论 、 方 法 、 技 术 及 应 用 系统 的 一 门 新 兴 的 科学 技术 。 它 是 涉及 认 知 科学 、 神 经 生物 学 、 心 理 
学 、 计 算 机 科学 、 数 学 、 信 息 与 控制 科学 等 诸多 学 科 的 交叉 性 、 前 沿 性 学 科 。 由 于 其 近年 的 
迅速 发 展 和 在 诸多 领域 中 的 广泛 应 用 ， 被 誉 为 20 世纪 70 年 代 以 来 世界 三 大 尖端 技术 (空间 
技术 、 能 源 技 术 、 人 工 智 能 ) 之 一 ， 也 被 称 为 21 世纪 的 三 大 尖端 技术 (基因 工程 、 纳 米 科 
学 、 人 工 智 能 ) 之 一 。 








1.1 人 工 智能 的 起 源 与 发 展 


1. 萌芽 期 

自古 以 来 ， 人 们 就 不 断 地 探索 制造 和 使 用 各 种 机 器 来 代替 人 的 部 分 脑力 劳动 ， 以 提高 人 
们 在 自然 环境 中 的 生存 能 力 。《 列 子 : 汤 问 》 中 ,记载 了 7 有关 西周 时 期 的 巧 匠 优 师 制造 的 能 
歌舞 的 机 器 人 的 传说 故事 。 公 元 850 年 ， 古 希腊 传说 中 有 关于 利用 制造 的 机 器 人 帮助 人 们 劳 
动 的 故事 记载 。 在 近代 史上 ， 关 于 制造 具有 智能 行为 机 器 人 的 记载 更 是 层出不穷 。 这 说 明 ， 
在 人 类 历史 的 发 展 过 程 中 ， 人 们 从 未 间断 过 对 人 工 智能 的 探索 和 研究 。 

古 希 腊 哲学 家 亚 里 士 多 德 ( Aristotle ) 是 逻辑 学 的 创始 人 ， 他 所 提出 的 三 段 论 (大 前 
提 、 小 前 提 和 绪论) 黄 定 了 演绎 推理 的 基础 。 

17 世纪 志 界 上 第 一 台 会 演算 的 机 械 加 法 器 由 法 国 物理 学 家 、 数 学 家 帕斯卡 (B. Pascal) 
研制 成 功 。 在 此 基础 上 ， 德 国 数学 家 、 哲 学 家 莱 布 尼 效 〈G. W. Leibniz) 研制 了 能 进行 四 则 
运算 的 计算 器 ， 并 提出 了 “万 能 符号 ”和 “推理 计算 ”的 思想 ， 成 为 现代 “思考 ”机 器 的 
设计 思想 萌芽 。 

进入 20 世纪 后 ， 人 工 智 能 领域 相继 出 现 春 干 开创 性 的 工作 。 其 中 ， 英 国 数学 家 、 计 算 
机 逻辑 的 奠基 者 图 灵 (A. M. Truring) 对 人 工 智能 的 发 展 做 出 了 杰出 的 贡献 。 

1936 年 ， 年 仅 24 岁 的 图 灵 发 表 了 著名 的 《 论 数字 计算 在 决断 难题 中 的 应 用 》 一 文 ， 提 
出 了 著名 的 图 灵机 的 设想 。 图 灵机 是 一 种 抽象 计算 模型 ， 用 来 精确 定义 可 计算 函数 。 图 灵 在 
设计 了 该 模型 后 提出 : 凡 可 计算 的 函数 都 可 用 这 样 的 机 器 来 实现 。 这 就 是 著名 的 图 灵 论 题 。 
半 个 多 世纪 以 来 ， 数 学 家 提出 的 各 种 各 样 的 计算 模型 都 被 证 明 是 和 图 灵机 等 价 的 。 现 在 图 灵 
论题 已 被 当成 公理 一 样 在 使 用 着 。 

1950 年 ， 图 灵 发 表 了 《计算 机 能 思考 吗 ?》 的 论文 ， 这 篇 划时代 之 作为 他 赢得 了 “人 工 
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智能 之 父 ” 的 桂冠 。 为 了 证 明 机 需 是 否 真 的 能 够 思考 ， 他 又 提出 了 “图 灵 测 试 ”。 

所 谓 图 灵 测 试 ， 是 一 种 测试 机 器 是 不 是 具备 智能 的 方法 。 被 测试 者 中 有 一 个 人 ， 另 一 个 
是 声称 具有 智能 的 机 器 。 测 试 时 ， 测试 人 与 被 测试 者 分 开 ， 测 试 人 通过 一 些 装置 (如 键盘 
等 ) 向 被 测试 者 进行 提问 。 经 过 一 段 时 间 的 提问 后 ， 如 果 测 试 人 无 法 分 辨 出 人 和 机 器 ， 则 
该 机 顺 就 通过 了 图 灵 测 试 ， 可 认为 该 机 顺 具 有 智能 。 图 灵 测 试 至 今 仍 被 沿用 。 可 惜 到 目前 为 
止 ， 还 没有 一 台 机 器 能 够 通过 图 灵 测 试 。 不 过 有 些 软件 可 以 通过 图 灵 测 试 的 子 测 试 。 

1946 年 ， 第 一 台 通用 电子 数字 计算 机 ENIAC 由 美国 数学 家 莫 克 利 (J.W. Mauchly) 和 
埃 克 特 (J.P. Eckert) 合作 研制 成 功 。 

1947 年 ， 美 国 数学 家 维 纳 (N. Wiener) 创立 了 控制 论 ， 揭 示 了 机 器 中 的 通信 和 控制 机 
能 与 人 的 神经 、 感 觉 机 能 的 共同 规律 ， 为 现代 科学 技术 研究 提供 了 胃 新 的 科学 方法 。 

1948 年 ， 美 国 贝 尔 实验 室 的 数学 家 香农 (C. E. Shannon) 创立 了 信息 论 ， 信息论 是 运用 
概率 论 与 数理 统计 的 方法 研究 信息 、 信 息 粹 、 通 信和 系统、 数据 传输 、 密 码 学 、 数 据 压 缩 等 问 
题 的 应 用 数学 学 科 。 

1952 年 ， 美 籍 奥地利 生物 学 家 贝塔 朗 菲 (L. V. Bertalanffy) 创立 了 系统 论 。 系 统 论 是 研 
究 系 统 的 一 般 模式 、 结 构 和 规律 的 学 问 ， 它 研究 各 种 系统 的 共同 特征 ， 用 数学 方法 定量 地 描 
述 其 功能 ， 寻 求 并 确立 适用 于 一 切 系统 的 原理 、 原 则 和 数学 模型 ， 是 具有 逮 辑 和 数学 性 质 的 
一 门 新 兴 的 科学 。 

这 一 时 期 的 主要 成 就 是 创立 数理 逻辑 、 自 动机 理论 、 控 制 论 、 信 息 论 和 系统 论 ， 以 及 通 
用 电子 数字 计算 机 的 发 明 。 这 些 成 就 为 人 工 智 能 的 诞生 和 迅速 发 展 提供 了 充足 的 思想 、 理 论 
和 实验 工具 等 物质 技术 条 件 。 

2. 形成 期 

1956 年 ， 达 特 茅 斯 会 议 的 召开 标志 着 人 工 智 能 学 科 的 正式 诞生 。 该 会 议 由 麦卡锡 
(John McCarthy，1971 年 的 图 灵 奖 获得 者 ) 、 明 斯 基 (Marvin L. Minsky，1969 年 图 灵 奖 获得 
者 ) 、 香 农 (Claude Elwood Shannon) 、 罗 切 斯 特 (Nathaniel Rochester) 4 个 年 轻 人 发 起 ， 普 
林 斯 顿 大 学 的 英 尔 (Trenchard More) 、IBM 公司 的 塞 织 尔 ( Arthur Samuel ) 、 麻 省 理工 的 索 
罗 蒙 夫 ( Ray Solomonoff) 和 塞 尔 夫 里 奇 (Oliver Selfridge)、 卡 内 基 梅 隆 大 学 的 纽 厄 尔 
( A. Newell ，1975 年 图 灵 奖 获得 者 ) 和 西蒙 (Simon，1975 年 图 灵 奖 获得 者 ) 等 共 10 人 参 
加 ， 探 讨 了 用 机 需 模拟 智能 的 各 种 相关 问题 ， 并 正式 提出 了 人 工 智 能 这 一 术语 。 

东道 主 麦 卡 锡 有 一 个 宏伟 的 目标 : 组 织 十 来 个 人 ， 用 两 个 月 的 时 间 共 同 努 力 设计 出 一 台 
具有 真正 智能 的 机 器 。 虽 然 他 们 没有 实现 这 个 目标 ， 但 是 他 们 却 创立 了 一 个 轩 新 的 学 科 一 一 
人 工 智能 。 麦 卡 锡 也 被 誉 为 人 工 智 能 之 父 。 

麦卡锡 的 主要 研究 方向 是 计算 机 下 棋 ， 并 发 明了 著名 的 a-B 搜索 算法 。 在 该 算法 中 ， 
麦卡锡 巧妙 地 将 结 点 的 产生 与 求 评价 函数 值 结合 起 来 ， 从 而 使 得 某 些 子 树 节 点 根本 不 必 产 生 
和 搜索 。 该 算法 至 今 仍 是 人 工 智 能 领域 中 一 种 高 效 常 用 的 求解 方法 。 

卡 内 基 梅 隆 大 学 的 西蒙 和 纽 厄 尔 在 大 会 上 展示 了 启发 式 程序 “逻辑 理论 家 ”， 它 可 以 证 
明 数 学 名 著 《 数 学 原理 》 一 书 第 2 章 52 个 定理 中 的 38 个 定理 。 该 程序 模拟 了 人 类 用 数理 逻 
辑 证 明定 理 时 的 思维 特点 ， 把 认 知 理论 、 人 机 交互 等 结合 起 来 ， 建 立 了 一 个 “智能 问题 解 
决 和 学 习 ” 模 型 ， 只 要 事先 在 机 器 中 存储 一 组 公理 和 推理 规则 ， 该 程序 就 可 自己 去 探索 解 
决 方案 。 这 是 利用 机 器 对 人 的 高 级 思维 活动 实现 模拟 的 第 一 个 重大 成 果 。 另 外 ， 在 开发 
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第 1 章 绪论 《eE 


“逻辑 理论 家 ”的 过 程 中 ， 他 们 首次 提出 并 成 功 应 用 了 “链表 ” (list) 作为 基本 的 数据 结 
构 ， 并 设计 和 实现 了 表 处 理 语言 I PL。IPL 是 最 早 的 表 处 理 语言 ， 也 是 最 早 使 用 递归 子 程序 
的 语言 。 

明 斯 基 在 会 议 上 展示 了 名 为 Snarc 的 学 习 机 的 骏 形 。Snare 是 世界 上 第 一 个 神经 网 络 模 
拟 器 ， 主 要 用 于 学 习 如 何 穿 过 迷宫 。 其 组 成 包括 40 个 智能 体 〈agent) 和 1 个 对 成 功 给 予 奖 
励 的 系统 。 在 Snarc 的 基础 上 ， 明 斯 基 解 决 了 如 何 让 机 器 利用 过 去 的 知识 实现 对 当前 行为 结 
果 的 预测 这 一 问题 。 

塞 缪 尔 在 1952 年 运用 博弈 理论 和 状态 空间 搜索 技术 研制 了 世界 上 第 一 个 跳棋 程序 ， 经 
过 不 断 完 善 ，1959 年 该 程序 击败 了 它 的 设计 者 塞 纱 尔 本 人 ，1962 年 击败 了 美国 的 一 个 州 冠 
军 。 该 程序 具有 自学 习 、 自 组 织 和 自 适应 能 力 ， 可 以 像 一 个 真正 的 棋 手 那样 学 习 棋 谱 和 积累 
下 棋 经 验 。 这 是 模拟 人 类 学 习 过 程 的 一 次 有 效 尝试 。 

1956 年 ， 乔 姆 斯 基 (N. Chomsky) 发 表 了 用 形式 语言 方法 研究 自然 语言 的 第 一 篇 论文 ， 
创立 了 形式 语言 。 形 式 语言 与 自动 机 结合 ， 用 来 描述 和 研究 思维 过 程 。 在 上 自然 语言 理解 和 翻 
译 、 计 算 机 语言 的 描述 和 编译 、 社 会 和 自然 现象 的 模拟 、 语 法 制导 的 模式 识别 等 方面 有 着 广 
泛 的 应 用 。 

1960 年 ， 西 蒙 夫妇 通过 一 个 有 趣 的 心理 学 实验 表明 ， 人 类 解决 问题 的 过 程 是 一 个 搜索 
的 过 程 ， 其 效率 取决 于 启发 式 函 数 。 在 这 个 实验 的 基础 上 ， 西 蒙 、 纽 厄 尔 和 肖 (J . Shaw ) 
等 人 成 功 地 开发 了 “通用 问题 求解 系统 ”GPS ( General Problem Solver) 。GPS 是 根据 人 在 解 
题 中 的 共同 思维 规律 编制 而 成 的 ， 可 以 求解 11 种 不 同类 型 的 问题 ， 从 而 使 启发 式 程序 有 了 
更 普遍 的 意义 。 

1959 年 ， 麦卡锡 开发 了 著名 的 表 处 理 语言 LISP，LISP 是 一 种 函数 式 的 符号 处 理 语 言 ， 
其 程序 由 一 些 函 数 子 程序 组 成 。LISP 语言 还 具有 自 编译 能 力 。 该 语言 成 为 人 工 智 能 界 第 一 
个 最 广泛 流行 的 语言 。 

这 一 时 期 的 主要 成 就 是 人 工 智 能 学 科 的 正式 诞生 ， 并 在 定理 证 明 、 问 题 求解 、 博 弈 和 
LISP 语言 以 及 模式 识别 等 许多 领域 取得 众多 突破 成 果 ， 人 工 智能 作为 一 门 新 兴学 科 迅 速 受 
到 人 们 的 关注 。 

3. 发 展期 

20 世纪 60 年 代 以 来 ， 人 工 智 能 的 研究 活动 越 来 越 受 到 国内 外 专家 学 者 的 重视 。 其 不 但 
在 问题 求解 、 博 蛮 、 定 理 证 明 、 程 序 设 计 、 机 各 视觉 、 自 然 语 言 理解 等 领域 的 研究 取得 深入 
进展 ， 而 且 开 始 走向 实用 化 的 应 用 研究 。 人 工 智 能 的 理论 和 成 果 广 泛 地 被 应 用 于 化 学 、 医 
疗 、 气 象 、 地 质 、 军 事 、 教 学 等 诸多 领域 中 。 

1972 年 ， 法 国 马 赛 大 学 的 科 麦 瑞 尔 (A. Comerauer) 提出 并 实现 了 逻辑 程序 设计 语言 
PROLOG。 同 年 ， 斯 坦 福 大 学 的 肖 特 利夫 〈E. H. Shortliffe) 等 人 开始 研制 MYCIN 专家 系统 。 
该 专家 系统 是 用 于 诊断 和 治疗 细菌 感染 性 疾病 的 系统 ， 该 系统 能 够 识别 51 种 病菌 ， 处 理 23 
种 抗菌 素 ， 能 够 为 患者 提供 最 佳 处 方 。 

1991 年 8 月 在 悉尼 召开 的 第 12 届 国 际 人 工 智 能 联合 会 议 上 ，IBM 公司 研制 的 “深蓝 ” 
(Deep Thought) 计算 机 系统 与 澳大利亚 国际 象棋 冠军 翰 森 (D. Johansen) 举行 了 一 场 人 机 
大 战 ， 最 终 以 1 : 1 平局 结束 。1996 年 2 月 ，IBM 公司 邀请 国际 象棋 棋 王 卡 斯 帕 罗 夫 ( Kasp- 
arov) 与 “深蓝 ”计算 机 系统 进行 人 机 大 战 ， 不 过 最 终 棋 王 卡 斯 帕 罗 夫 以 4 : 2 赢得 了 比赛 。 
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但 一 年 后 ，1997 年 5 月 ， 深 蓝 再 次 挑战 卡 斯 帕 罗 夫 ,， 并 以 3.5 : 2.5 的 成 绩 击败 了 卡 斯 帕 
罗 夫 。 

2016 年 3 月 ，AlphaGo 以 4 :1 的 战绩 战胜 了 韩国 棋 手 李 世 石 。2017 年 5 月 ， 则 以 3 :0 
的 战绩 击败 了 围棋 排名 世界 第 一 的 柯 杰 。 

在 我 国 ， 类 人 性 机 器 人 的 研究 受到 机 械 和 自动 控制 工作 者 的 重视 。 中 国 科 学 技术 大 学 一 
直 从 事 两 足 步 行 机 器 人 、 类 人 性 机 器 人 的 研究 开发 ， 在 1990 年 成 功 研制 出 我 国 第 一 台 两 足 
步行 机 器 人 人。 同时， 经 过 10 年 的 辛苦 销 研 ， 于 2000 年 11 月 ， 又 成 功 研制 出 我 国 第 一 台 类 
人 形 机 器 人 ， 并 使 其 具备 了 一 定 的 语言 能 力 。 它 的 行走 频率 从 过 去 的 每 6 秒 一 步 ， 加 快 到 每 
秒 2 步 ， 从 只 能 平静 地 静态 步行 ， 到 能 快速 自如 地 动态 步行 ， 从 只 能 在 已 知 的 环境 中 步行 ， 
到 可 在 小 偏差 、 不 确定 环境 中 行走 ， 取 得 了 机 器 人 神经 网 络 系统 、 生 理 视觉 系统 、 双 手 协调 
系统 、 手 指控 制 系统 等 多 项 重大 研究 成 果 。 

目前 ， 人 工 智能 技术 发 展 十 分 迅速 ， 在 人 脸 识 别 、 语 音 识别 、 图 像 理 解 、 步 态 识别 、 自 
动 控制 等 领域 得 到 了 成 功 应 用 。2017 年 8 月 中 央 电 视 台 综合 频道 播 出 了 科技 挑战 类 节 
目 一 一 《机 吞 过 人 》， 该 节目 是 由 中 央 电 视 台 和 中 国 科学 院 共同 主办 、 中 央 电 视 台 综合 频道 
和 北京 长 江 文化 股份 有 限 公司 联合 制作 的 人 工 智能 现象 级 节目 ， 该 节目 向 大 众 展示 了 我 国 科 
技 人 员 在 人 工 智能 领域 所 取得 的 部 分 科技 成 果 ， 既 具有 良好 的 趣味 性 ， 又 具有 很 好 的 科普 
性 。 在 2017 中 国 综艺 峰会 匠心 盛典 中 ,《 机 智 过 人 》 获 “年 度 匠 心 视 效 节目 ” 奖 。 



































1.2 人 工 智 能 学 术 流 派 


近年 来 ， 对 人 类 智能 的 理解 形成 了 3 个 学 派 ， 分 别 为 符号 主义 学 派 、 联 结 主义 学 派 和 行 
为 主义 学 派 。 

1. 符号 主义 (Symbolicism) 

符号 主义 又 称 逻 辑 主 义 (Logicism) 、 心 理学 派 (Psychologist) 或 计算 机 主义 (Comput- 
erism) ， 认 为 知识 的 基本 元 素 是 符号 ， 智 能 的 基础 依赖 于 知识 。 该 理论 倡导 以 符号 形式 的 知 
识 和 信息 为 基础 ， 主 要 通过 逻辑 推理 ， 运 用 知识 进行 问题 求解 。 

该 学 派 的 代表 人 物 有 : 纽 挡 尔 和 西蒙 、 费 根 饱 姆 (Feigenbaum ) 、 肖 特 里 菲 (Shortliffe) 
等 人 。 纽 龙 尔 和 西蒙 提出 了 著名 的 物理 符号 系统 假说 (Physical Symbol System Hypothesis ) ， 
提出 “a physical system is a machine that is capable of manipulating symbolic data”， 认 为 任何 一 
个 物理 符号 系统 如 果 是 有 智能 的 ， 则 肯定 能 执行 对 符号 的 输入 、 输 出 、 存 储 、 复 制 、 条 件 转 
移 和 建立 符号 结构 这 样 6 种 操作 。 反 之 ， 能 执行 这 6 种 操作 的 任何 系统 ， 也 就 一 定 能 够 表现 
出 智能 。 

根据 这 个 假设 ， 我 们 可 以 推出 以 下 绪论 : 人 是 具有 智能 的 ， 因 此 人 是 一 个 物理 符号 系 
统 ; 计算 机 是 一 个 物理 符号 系统 ， 因 此 它 必 具有 智能 ;计算 机 能 模拟 人 ， 或 者 说 能 模拟 人 的 
大 脑 功能 。 

费 根 饱 姆 (Stanford 大 学 ，1994 年 图 灵 奖 获得 者 ) 曾 师 从 于 西蒙 教授 ， 其 最 大 的 贡献 在 
于 最 早 倡导 并 率先 实践 了 “知识 工程 (Knowledge Engineering) ”， 使 之 成 为 AI 领域 中 取得 
实际 成 果 最 为 丰富 、 影 响 也 最 为 深远 的 一 个 分 文 。 同 时 ， 作 为 专家 系统 的 创始 人 ， 费 根 鲍 姆 
于 1968 年 成 功 地 研制 出 第 一 个 专家 系统 DENDRAL， 这 是 一 个 化 学 分 析 专 家 系统 ， 其 中 保 
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存 有 著名 化 学 家 的 知识 和 质谱 仪 的 知识 ， 可 以 根据 给 定 的 有 机 化 合 物 的 分 子 式 和 质谱 图 ， 从 
几 千 种 可 能 的 分 子 结构 中 挑选 出 一 个 正确 的 分 子 结构 。 这 次 有 益 的 探索 ， 有 力 地 证 明了 知识 
工程 学 说 的 正确 性 ， 其 意义 远 远 超过 了 系统 本 身 在 实用 上 所 创造 的 价值 。 

随后 ， 大 量 研究 成 果 不 断 涌现 。1972 年 ，Stanford 大 学 的 肖 特 里 非 (E. H. Shortliffe) 等 
人 成 功 开发 并 应 用 了 医疗 专家 系统 MYCIN， 对 人 工 智能 从 理论 分 析 走 向 工程 实践 产生 了 深 
刻 的 影响 。 

目前 ， 符 号 主义 遇 到 不 少 暂时 无 法 解决 的 困难 ， 如 仍然 无 法 用 数理 逻辑 建立 一 个 人 工 智 
能 的 统一 理论 体系 、 专 家 系统 热衷 于 自 成 体系 的 封闭 式 研究 ， 脱 离 了 主流 计算 〈 软 硬件 ) 
环境 等 。 知 识 工 程 学 派 的 困境 动 授 了 传统 人 工 智 能 物理 符号 系统 对 于 智能 行为 是 必要 的 也 是 
充分 的 基本 假设 , 促进 了 联结 主义 学 派 和 行为 主义 学 派 的 兴起 。 尽 管 如 此 ， 科 学 界 普遍 认 
为 ， 在 联结 主义 学 派 和 行为 主义 学 派出 现 以 后 ,符号 主义 仍然 是 人 工 智能 的 主流 。 

2. 联结 主义 (Connectionism) 

联结 主义 又 称 为 仿生 学 学 派 ( Bionicsism) 或 生理 学 派 〈physiologism ) ， 是 基于 生物 进 
化 论 的 人 工 智 能 学 派 ， 主 张 人 工 智 能 可 以 通过 模拟 人 脑 结构 来 实现 ， 主 要 内 容 就 是 人 工 神 经 
网 络 (ANN) 。 联 结 主义 认为 人 工 智 能 源 于 仿生 学 ， 特 别 是 对 人 脑 模型 的 研究 ， 认 为 人 的 思 
维基 元 是 神经 元 ， 而 不 是 符号 处 理 过 程 ， 人 脑 不 同 于 计算 机 ; 提出 联结 主义 的 大 脑 工 作 模 
式 ， 否 定 基于 符号 操作 的 计算 机 工作 模式 。 

该 学 派 的 代表 人 物 有 罗 和 森 布 莱 特 ( Rosenblatt) 、 威 德 罗 (Widow) 和 和 霍 夫 (Hoff)、 重 
梅 尔 哈 特 (Rumelhart) 和 麦克 莱 兰 (McCelland) 、 霍 普 菲 尔 德 (Hopfield) 等 人 。 

1943 年 ， 美 国 神经 生理 学 家 麦克 洛 奇 (W. McCulloch) 和 数学 家 皮 兹 〈W. Pitts) 提出 
了 著名 的 单 神经 元 M-P 模型 ， 开 创 了 神经 网 络 研究 的 时 代 ， 人 类 从 此 开始 探索 大 脑 智能 的 
奥秘 。 

1958 年 ， 风 森 布 莱 特 提出 并 描述 了 信息 在 人 脑 中 存储 记忆 的 数学 模型 ， 即 著名 的 感知 
机 模型 Perceptron; 威 德 罗 和 霍 夫 于 1962 年 首次 提出 了 网 络 学 习 训 练 的 算法 一 一 8 ( Delta) 
学 习 规则 (又 称 LMS 或 Widrow-Hoff 算法 ) ， 该 方法 借用 梯度 下 降 (又 称 最 速 下 降 ) 法 来 实 
现 网 络 权 值 矢量 的 调整 ， 与 Hebb 学 习 规 则 一 起 ， 并 称 为 ANN 两 种 基本 的 学 习 方法 。 鲁 梅 
尔 哈 特 和 麦克 莱 兰 对 ANN 的 突出 贡献 在 于 结合 早期 韦伯 斯 (Werbos) 的 误差 反 向 传播 理 
论 ， 提 出 了 著名 的 BP 神经 网 络 ， 实 现 了 Minsky 关于 多 层 网 络 的 设想 ， 至 今 仍 是 ANN 中 最 
为 重要 的 网 络 模型 。 以 发 明 者 命名 的 Hopfield 网 络 是 无 监督 、 反 馈 型 网 络 的 典型 代表 ， 其 明 
显 特征 在 于 与 电子 线路 有 一 个 明显 的 对 应 关系 ， 首 次 实现 了 硬件 对 网 络 结构 的 模拟 。 

ANN 在 过 去 的 20 年 间 获 得 了 重要 进展 ， 涉 及 该 领域 的 专著 、 期 刊 和 会 议论 文 数量 迅速 
增长 ， 对 推动 这 一 思潮 起 到 了 重要 作用 。 但 是 必须 看 到 ， 尽 管 对 ANN 的 多 数 研究 均 集 中 于 
网 络 结构 、 学 习 算 法 、 硬 件 实现 和 实际 应 用 领域 ， 并 且 在 许多 工程 领域 ， 如 非 线性 系统 方面 
取得 了 不 错 的 研究 成 果 ， 但 ANN 技术 本 身 也 有 若干 问题 亟待 解决 。 首 先 ， 网 络 达 不 到 开发 
多 种 多 样 知识 的 要 求 ， 单 靠 联 结 机 制 方法 很 难 解 决 人 工 智 能 中 的 全 部 问题 。 其 次 ，Hebb 学 
习 规 则 缺少 降低 权 值 的 调整 机 制 、Delta 学 习 规 则 具有 容易 陷 人 局 部 极 小 等 严重 缺陷 ， 缺 少 
可 操作 的 理论 来 保证 学 习 过 程 的 收敛 性 。 不 过 仍 可 以 确信 的 是 ，ANN 是 个 很 有 希望 的 发 展 
方向 ， 计 算 机 技术 为 其 发 展 提 供 了 坚实 的 技术 基础 ，ANN 自身 也 有 很 多 适合 于 控制 的 突出 
特性 ， 特 别 是 大 规模 人 工 神 经 网 络 硬件 也 取得 了 较 大 的 进展 。 



















































































C5) 





3 人 工 智能 技术 


3. 行为 主义 (Actionism) 

行为 主义 又 称 为 进化 主义 (Evolutionism) 或 控制 论 学 派 〈Cybermeticsism) 。 目 前 ， 人 工 
智能 界 对 行为 主义 的 研究 方兴未艾 。 该 学 派 源 于 控制 论 ， 倡 导 智 能 取决 于 感知 和 行为 ， 不 需 
要 知识 ， 不 需要 表示 ， 亦 不 需要 推理 ， 即 智能 行为 只 能 通过 现实 世界 中 与 周围 环境 交互 作用 
而 表现 出 来 。 

该 学 派 的 代表 人 物 是 MIT 的 罗 德 尼 : 布鲁克 斯 (Rodney A. Brooks) ， 他 于 1991 年 、 
1992 年 分 别提 出 了 “没有 表达 的 智能 ”“ 没 有 推理 的 智能 ”， 曙 覆 了 符号 一 知识 工程 一 专家 
系统 ， 或 节点 一 结构 一 神经 网 络 的 智能 脉络 。 行 为 主义 其 至 认为 : 符号 主义 和 联结 主义 对 真 
实 世 界 客观 事物 的 描述 及 其 智能 行为 工作 模式 是 过 于 简化 的 抽象 ， 因 而 是 不 能 真实 地 反映 客 
观 存在 的 。 目 前 ， 布 鲁 克 斯 创建 了 一 系列 著名 的 机 器 人 昆虫 和 类 人 机 器 人 ， 不 断 诠 释 着 反应 
式 Agent 的 特性 一 一 对 环境 主动 进行 监视 (所 谓 感知 ) ， 并 做 出 必要 的 反应 (所谓 动 作 )。 

诚然 ， 这 一 学 派 尚未 形成 完整 的 理论 体系 ， 有 待 进一步 研究 ， 但 它 与 人 们 的 传统 看 法 完 
全 相左 ， 引 起 了 人 工 智能 界 的 注意 。 同 时 ， 行 为 主义 学 派 的 兴起 ， 也 表明 了 控制 论 、 系 统 工 
程 的 思想 将 进一步 影响 人 工 智能 的 发 展 。 

同 其 他 学 科 的 不 同 流派 一 样 ， 符 号 主义 、 联 结 主义 和 行为 主义 在 理论 方法 和 技术 路 线 等 
方面 的 争论 ， 从 来 也 没有 停止 过 。 

在 理论 方法 方面 ， 符 号 主义 着 重 于 功能 模拟 ， 提 倡 用 计算 机 模拟 人 类 认 知 系统 所 具备 的 
功能 和 机 能 ; 联结 主义 着 重 于 结构 模拟 ， 通 过 模拟 人 的 生理 网 络 来 实现 智能 ; 行为 主义 着 重 
于 行为 模拟 ， 依 赖 感知 和 行为 来 实现 智能 。 

在 技术 路 线 方面 ， 符 号 主义 依赖 于 软件 路 线 ， 通 过 启发 性 程序 设计 ， 实 现 知识 工程 和 各 
种 智能 算法 ;联结 主义 依赖 于 硬件 设计 ， 如 VLSI (超大 规模 集成 电路 ) 、 脑 模型 和 智能 机 器 
人 等 ; 行为 主义 利用 一 些 相 对 独立 的 功能 单元 ， 组 成 分 层 异 步 分 布 式 网 络 ， 为 机 器 人 的 研究 
开创 了 新 的 方法 。 

以 上 三 个 学 派 将 长 期 共存 。 人 工 智 能 界 普遍 认为 ， 未 来 的 发 展 应 立足 于 各 学 派 之 间 求 同 
存 异 、 相 互 融合 。 同 时 ， 还 要 有 效 地 集成 数学 、 生 物 学 、 心 理学 、 哲 学 、 计 算 机 学 、 机 器 人 
学 、 控 制 科学 以 及 信息 学 等 ， 促 进 人 工 智能 从 软件 到 硬件 、 从 理论 分 析 到 工程 应 用 的 完备 
作 二 




























































































1.3 人工 智能 的 研究 与 应 用 领域 





目前 ， 随 着 人 工 智 能 技术 的 迅猛 发 展 ， 几 乎 各 种 技术 领域 的 发 展 都 涉及 人 工 智 能 技术 ， 
可 以 说 人 工 智 能 已 经 广泛 应 用 到 许多 实际 领域 中 。 其 典型 的 应 用 包括 : 专家 知识 系统 、 机 融 
学 习 、 模 式 识 别 、 自 动 定 理 证 明 、 自 然 语 言 理 解 、 智 能 决策 支持 系统 、 人 工 神经 网 络 及 博 
琵 等 。 

1. 专家 系统 (Expert Systems) 

通常 ， 专 家 系统 是 指 一 个 智能 程序 ， 它 能 够 对 某 些 需要 专家 知识 才能 解决 的 应 用 问题 给 
出 具有 专家 水 平 的 解答 。 

20 世纪 60 年 代 ， 专 家 系统 逐渐 发 展 起 来 ， 它 是 人 工 智 能 研究 中 开展 较 早 、 最 活跃 、 成 
效 最 多 的 领域 。1977 年 ， 费 根 饱 姆 提出 “知识 工程 ”， 把 实用 的 人 工 智能 称 为 知识 工程 ， 标 
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志 着 人 工 智 能 研究 进入 实际 应 用 的 阶段 。 之 后 ， 雨 后 春 筹 般 地 出 现 了 一 大 批 应 用 于 各 领域 的 
专家 系统 ， 涉 及 医学 、 化 学 、 法 律 、 农 业 、 商 业 、 和 生物、 工程 、 教 育 、 军 事 等 领域 ， 产 生 了 
很 好 的 社会 与 经 济 效益 。 

专家 系统 是 依靠 人 类 专家 已 有 的 知识 建立 起 来 的 知识 系统 ， 是 一 种 具有 特定 领域 内 大 量 
知识 与 经 验 的 程序 系统 。 

与 传统 的 计算 机 程序 相 比 ， 专 家 系统 是 以 知识 为 中 心 ， 注 重 知识 本 身 而 不 是 确定 的 算 
法 。 根 据 专家 的 理论 知识 和 实际 经 验 ， 对 人 们 还 没有 进行 精确 描述 和 严格 分 析 的 问题 ， 在 不 
确定 或 不 精确 的 信息 基础 上 做 出 判断 。 标 准 的 计算 机 程序 能 精确 地 区 分 出 每 一 任务 应 该 如 何 
完成 ， 而 专家 系统 则 是 告诉 计算 机 做 什么 。 它 应 用 人 工 智能 技术 、 模 拟人 类 专家 解决 问题 时 
的 思维 过 程 ， 来 求解 特定 领域 内 的 各 种 问题 ， 达 到 或 接近 专家 的 水 平 。 

专家 系统 突出 了 知识 的 价值 ， 大 大 减少 了 知识 传授 和 应 用 的 代价 ， 使 专家 的 知识 迅速 变 
成 社会 的 财富 。 另 外 ， 专 家 系统 采用 的 是 人 工 智能 的 原理 和 技术 ， 如 符号 表示 、 符 号 推理 、 
启发 式 搜 索 等 ， 与 一 般 的 数据 处 理 系统 不 同 。 

随 着 人 工 智能 的 不 断 发 展 和 提高 ， 各 种 新 型 的 高 级 专家 系统 正在 积极 地 开发 应 用 中 。 所 
谓 的 高 级 专家 系统 是 指 为 了 克服 传统 专家 系统 的 缺陷， 不 仅 采用 基于 规则 的 方法 ， 而 且 还 采 
用 基于 框架 的 技术 和 基于 模型 的 原理 的 新 型 专家 系统 。 它 包括 分 布 式 专家 系统 、 协 同 式 专家 
系统 、 模 糊 专家 系统 、 神 经 网 络 专 家 系统 和 基于 Web 的 专家 系统 等 。 

2. 机 器 学 习 (Machine Learning) 

人 类 具有 智能 的 一 个 重要 标志 就 是 人 类 拥有 学 习 能 力 。 同 样 ， 机 器 的 智能 性 也 可 通过 机 
器 学 习 来 体现 。 作 为 人 工 智能 的 一 个 重要 研究 领域 ， 机 器 学 习 就 是 研究 如 何 使 计算 机 模拟 或 
实现 人 类 的 学 习 行 为 ， 以 获得 新 的 知识 或 技能 ， 从 而 实现 自身 的 不 断 完善 。 

机 器 学 习 的 研究 与 认 知 科学 、 神 经 心理 学 、 逻 辑 学 等 学 科 都 有 着 密切 的 联系 ， 并 对 人 工 
智能 的 其 他 分 文 ， 如 专家 系统 、 自 然 语言 理解 、 自 动 推理 、 智 能 机 咒 人 、 计 算 机 视觉 、 计 算 
机 听觉 等 方面 ， 起 到 重要 的 推动 作用 。 

机 器 学 习 根据 生理 学 、 认 知 科学 等 对 人 的 学 习 机 理 的 理解 ， 建 立 人 类 学 习 过 程 的 计算 模 
型 ， 发 展 各 种 学 习 理论 和 学 习 方 法 ， 开 发 通用 的 学 习 算法 ， 建 立 面向 任务 的 具有 一 定 应 用 性 
的 学 习 系 统 。 

机 器 学 习 经 过 多 年 的 发 展 ， 已 经 形成 了 许多 学 习 方 法 ， 如 : 监督 学 习 、 非 监督 学 习 、 传 
授 学 习 、 机 械 学 习 、 发 现 学 习 、 类 比 学 习 、 事 例 学 习 、 连 接 学 习 、 遗 传 学 习 等 。 而 目前 ， 人 
工 智 能 领域 最 热门 的 科目 之 一 是 深度 学 习 。 深 度 学 习 已 在 笔迹 识别 、 面 部 识别 、 语 音 识别 、 
自动 驾 怠 、 自 然 语言 处 理 、 生 物 信息 数据 分 析 等 方面 取得 成 功 应 用 。AlphaGo 中 也 应 用 了 深 
度 学 习 。AlphaGo 的 优势 之 一 就 是 能 够 进行 自我 学 习 ， 也 就 是 说 ，AlphaGo 能 够 和 不 同 版 本 
的 “自己 ”进行 下 横 ， 从 而 每 次 都 可 以 获得 一 点 小 小 的 进步 ， 由 此 ，Alphaco 获得 了 “ 思 
维 ” 能 力 。 具 体 来 说 ，AlphaGo 具有 一 套 针 对 围棋 而 设计 的 深度 学 习 系 统 ， 将 增强 学 习 、 深 
度 神 经 网 络 、 策 略 网 络 、 快 速 走 子 、 估 值 网 络 和 蒙特 卡 洛 树 搜索 进行 整合 ， 同 时 利用 Google 
强大 的 硬件 支撑 和 云 计 算 资 源 ， 依 靠 CPU+CPU 运算 ， 通 过 增强 学 习 和 自我 博弈 学 习 不 断 提 
高 自身 水 平 。 因 此 ，AlphaGo 也 可 看 做 机 融 学 习 的 一 个 成 功 案 例 。 

3. 模式 识别 (Pattern Recognition ) 

模式 识别 是 根据 研究 对 象 的 特征 或 属性 ， 利 用 以 计算 机 为 中 心 的 机 器 系统 运用 一 定 的 分 析 
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3) 人 工 智能 技术 





算法 认定 它 的 类 别 ， 系 统 应 使 分 类 识别 的 结果 尽 可 能 地 符合 真实 。 模 式 识别 是 一 门 综合 性 、 交 
叉 性 学 科 。 在 理论 上 涉及 代数 、 算 阵 论 、 概 率 论 、 图 论 、 模 糊 数 学 、 最 优化 理论 等 众多 学 科 的 
知识 ， 在 应 用 上 又 与 其 他 许多 领域 的 工程 技术 密切 相关 ， 其 内 涵 可 以 概括 为 信息 处 理 、 分 析 与 
决策 ， 它 既是 人 工 智能 研究 领域 的 重要 分 文 ， 又 是 实现 机 顺 智能 必 不 可 少 的 技术 手段 。 

目前 ， 模 式 识别 理论 和 技术 已 成 功 地 应 用 于 工业 、 农 业 、 国 防 、 科 研 、 人 公安、 生物 医 
学 、 气 象 、 天 文学 等 许多 领域 ， 如 信件 自动 分 检 、 指 纹 识 别 、 生 物 医 学 的 细胞 或 组 织 分 析 、 
和 遥感 图 片 的 机 器 判读 、 系 统 的 故障 诊断 以 及 文字 与 语言 的 识别 等 ， 并 且 正 不 断 扩 展 到 许多 其 
他 领域 。 

尽管 现在 机 融 识 别 的 水 平 还 远 不 如 人 脑 ， 但 随 着 模式 识别 理论 以 及 其 他 相关 学 科 的 发 
展 ， 可 以 预言 ， 它 的 功能 将 会 越 来 越 强 ， 应 用 也 会 越 来 越 广泛 。 

4. 自动 定理 证 明 ( Automatic Theorem Proving) 

定理 证 明 是 最 典型 的 逻辑 推理 问题 ， 它 对 人 工 知 能 的 发 展 曾经 产生 过 重要 影响 。 在 数学 
领域 中 对 已 测 得 定理 寻求 一 个 证 明 或 者 反 证 ， 是 一 项 艰巨 的 智能 任务 。 定 理 证 明 过 程 中 ， 不 
仪 要 根据 假设 进行 演绎 ,还 需要 某 些 直觉 的 技巧 。 例 如 ,为 了 证 明 一 个 定理 ,数学 家 要 设想 
需要 先 证 明 哪些 引 理 ， 并 运用 他 的 判断 力 推测 出 已 证 明 的 哪些 结论 会 在 这 个 定理 的 证 明 中 起 
作用 ， 并 把 主要 问题 分 解 成 奉 干 子 问 题 ， 然 后 再 对 各 个 子 问题 进行 求解 。 

自动 定理 证 明 是 让 计算 机 自动 地 进行 推理 和 证 明 数 学 定理 ， 自 动 模拟 人 类 证 明 非 数值 符号 
的 演算 过 程 。 很 多 非 数值 领域 的 任务 如 医疗 诊断 、 信 息 检索 、 规 划 制 度 和 难题 求解 等 方面 都 可 
以 转化 成 一 个 定理 证 明 的 问题 ， 因 此 自动 定理 证 明 的 研究 在 人 工 智能 领域 具有 普遍 意义 。 

5. 自然 语言 理解 (Natural Language Understanding) 

自然 语言 是 人 类 相互 之 间 进 行 信息 交流 的 主要 媒介 ， 人 们 之 所 以 能 够 轻松 自如 地 进行 交 
流 ， 是 因为 人 类 有 很 强 的 自然 语言 理解 能 力 。 自 然 语言 充满 靶 义 、 结 构 复 杂 多 样 、 语 义 表达 
千变万化 、 结 构 和 语义 之 间 有 着 和 干 丝 万 缕 、 错 综 复 杂 的 联系 ， 这 使 得 计算 机 系统 与 人 类 的 交 
互 只 能 限制 在 各 种 非 自 然 语言 上 。 

自然 语言 理解 研究 用 计算 机 模拟 人 的 语言 交际 过 程 ， 使 计算 机 能 理解 和 运用 人 类 社会 的 
自然 语言 如 汉语 、 英 语 等 ， 实 现 人 机 之 间 的 自然 语言 通信 ， 以 代替 人 的 部 分 脑力 劳动 ,包括 
查询 资料 、 解 答 问 题 、 摘 录 文 献 、 汇 编 资料 以 及 一 切 有 关 自 然 语 言 信息 的 加 工 处 理 。 这 在 当 
前 新 技术 革命 的 浪潮 中 占有 十 分 重要 的 地 位 。 研 制 第 5 代 计 算 机 的 主要 目标 之 一 ， 就 是 要 
使 计算 机 具有 理解 和 运用 自然 语言 的 功能 。 

与 日 然 语 言 理解 密切 相关 的 男 一 个 领域 是 机 融 翻 译 ， 即 用 计算 机 把 一 种 语言 翻译 成 男 一 
种 语言 。20 世纪 60 年 代 ， 国 外 对 机 咒 翻 译 曾 有 大 规模 的 研究 工作 ， 耗 费 了 巨额 费用 ， 但 人 
们 当时 显然 是 低估 了 自然 语言 的 复杂 性 ， 语 言 处 理 的 理论 和 技术 均 不 成 熟 ， 所 以 进展 不 大 。 

近年 来 ， 尽 管 自然 语言 理解 和 机 器 翻译 都 已 取得 一 定 进 展 ， 但 要 真正 建立 一 个 能 够 生成 
和 理解 自然 语言 的 计算 机 处 理 系统 是 相当 困难 的 ， 这 离 计算 机 完全 理解 人 类 自然 语言 的 目标 
还 相差 甚 还 。 因 此， 对 自然 语言 理解 的 研究 就 成 为 人 工 智能 研究 的 一 个 非常 重要 的 课题 。 

6. 人 工 神经 网 络 (Artificial Neural Network ) 

人 工 神经 网 络 是 指 用 大 量 的 简单 计算 单元 ( 即 神经 元 ) 构成 的 非 线 性 系统 ， 在 一 定 程 
度 和 层次 上 模仿 了 人 脑 神经 系统 的 信息 处 理 、 存 储 及 检索 功能 ， 因 而 具有 学 习 、 记 忆 和 计算 
等 智能 处 理 功能 。 
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人 工 神 经 网 络 的 研究 内 容 相当 广泛 ， 反 映 了 多 学 科 交 叉 技 术 领 域 的 特点 。 目 前 ， 主 要 的 
研究 工作 集中 在 以 下 几 个 方面 : 

(1) 生物 原型 研究 。 从 生理 学 、 心 理学 、 解 剖 学 、 脑 科学 、 病 理学 等 生物 科学 方面 研 
究 神 经 细胞 、 神 经 网 络 、 神 经 系统 的 生物 原型 结构 及 其 功能 机 理 。 

(2) 建立 理论 模型 。 根 据 生物 原型 的 研究 ， 建 立 神经 元 、 神 经 网 络 的 理论 模型 。 其 中 
包括 概念 模型 、 知 识 模 型 、 物 理化 学 模型 、 数 学 模型 等 。 

(3) 网 络 模型 与 算法 研究 。 在 理论 模型 研究 的 基础 上 构建 具体 的 神经 网 络 模 型 ， 以 实 
现 计算 机 模拟 或 硬件 化 实现 。 这 方面 的 研究 也 包括 网 络 动力 学 特性 分 析 、 学 习 算 法 构建 等 内 
容 的 研究 。 近 年 来 ， 忆 阻 器 件 的 出 现 对 神经 网 络 硬件 化 实现 开辟 了 新 的 研究 方向 。 

(4) 人 工 神 经 网 络 应 用 系统 。 在 网 络 模型 与 算法 研究 的 基础 上 ， 利 用 人 工 神经 网 络 组 
成 实际 的 应 用 系统 ， 例 如 ， 完 成 某 种 信号 处 理 或 模式 识别 的 功能 、 实 现 系统 推理 决策 或 作为 
自动 化 系统 的 控制 咒 等 。 特 别 是 最 近 几 年 ， 卷 积 神经 网 络 在 模式 识别 等 领域 中 的 应 用 取得 了 
令 人 瞩目 的 效果 。 

7. 智能 决策 支持 系统 (Intelligent Decision Support System) 

决策 系统 是 管理 科学 的 一 个 分 文 ， 把 人 工 智 能 中 的 专家 系统 和 决策 系统 有 机 地 结合 就 形 
成 了 智能 决策 系统 。 它 是 近年 来 新 兴 的 一 个 研究 领域 。 它 既 充 分 发 挥 了 传统 决策 支持 系统 中 
的 数值 分 析 优势 ， 也 充分 发 挥 了 专家 系统 中 知识 及 知识 处 理 的 特长 ， 既 可 以 进行 定量 分 析 ， 
又 可 以 进行 定性 分 析 ， 能 有 效 地 解决 半 结 构 化 的 问题 ， 从 而 扩大 了 决策 支持 系统 的 应 用 范 
围 ， 提 高 了 决策 支持 系统 的 能 

8. 博弈 (Game Playing ) 

十 弈 就 是 在 多 决策 主体 之 间 的 行为 具有 相互 作用 时 ,各 主体 根据 所 掌握 信息 及 对 自身 能 
力 的 认 知 ， 做 出 有 利于 自己 的 决策 的 一 种 行为 。 

十 弈 论 是 二 人 或 多 人 在 平等 的 对 局 中 各 自 利 用 对 方 的 策略 变换 自己 的 对 抗 策略 ， 达 到 取 
胜 目 标的 理论 ， 是 研究 互动 决策 的 理论 。 博 穿 可 以 分 析 自 己 与 对 手 的 利 次 关系 ， 从 而 确立 自 
己 在 博弈 中 的 优势 ， 因 此 有 不 少 博弈 理论 ， 可 以 帮助 对 弈 者 分 析 局 势 ， 从 而 采取 相应 策略 ， 
最 终 达 到 取胜 的 目的 。 

韦 弈 的 类 型 分 为 : 合作 博弈 、 非 合作 博弈 、 完 全 信息 博弈 、 非 完全 信息 博弈 、 静 态 博 

在 机 器 博弈 方面 ，1956 年 ， 人 工 智 能 的 先驱 之 一 塞 缘 尔 就 研制 出 跳棋 程序 ， 这 个 
程序 能 够 从 棋谱 中 进行 学 习 ， 并 能 从 实战 中 总 结 经 验 。 当 时 最 秦 动 的 一 条 新 闻 是 塞 纪 尔 的 跳 
棋 程 序 下 启 了 美国 一 个 州 的 跳棋 冠军 。 

1997 年 ，IBM 的 “深蓝 ”计算 机 以 2 胜 3 平 1 负 的 战绩 击败 了 蝉联 12 年 之 久 的 世界 国 
际 象棋 冠军 。2001 年 ,德国 的 “更 弗 里 次 ”国际 象棋 软件 击败 了 当时 世界 排名 前 10 位 棋 手 
中 的 9 位 。2004 年 ， 仅 配备 一 个 CPU (AMD Athlon64 3400+) 的 紫光 之 星 笔 记 本 电脑 以 
2 : 0 战胜 棋 后 。 这 些 事 实说 明 机 器 在 博弈 上 已 具有 一 定 的 智能 性 。 

与 象棋 不 同 ， 围 棋 的 棋盘 空间 更 大 ， 变 化 也 更 加 复杂 ， 因 此 ， 在 AlphaGo 出 现 以 前 ， 一 
直 没 有 与 围棋 高 手相 抗衡 的 计算 机 软件 。AlphaGo 的 开发 团队 是 DeepMind，DeepMind 是 由 
人 工 智能 程序 师 兼 神经 科学 家 戴 密斯 : 哈 萨 比 斯 (Demis Hassabis) 等 人 于 2010 年 9 月 在 英 
国 创立 的 人 工 智能 企业 ， 它 将 机 器 学 习 和 系统 神经 科学 的 最 先进 技术 结合 起 来 ， 建 立 了 强大 
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的 通用 学 习 算法 。2014 年 ，Google 公司 以 将 近 4 亿美 元 的 价格 收购 了 该 公司 ， 在 不 到 6 年 
的 时 间 里 ，DeepMind 开发 出 了 能 够 战胜 人 类 专业 围棋 选手 的 AlphaGo， 展 示 了 人 工 智能 不 可 
抵挡 的 发 展 趋势 。 

9. 智能 机 器 人 ( Intelligent Robot) 

智能 机 器 人 是 指 具 有 人 类 所 特有 的 某 种 智能 行为 的 机 器 ， 它 是 在 电子 学 、 人 工 智能 、 控 
制 理 论 、 系 统 工 程 、 机 械 工程 、 仿 生 学 以 及 心理 学 等 各 个 学 科 基 础 上 发 展 起 来 的 综合 性 学 
科 。 由 于 它 是 直接 面向 应 用 的 ， 社 会 效益 强 ， 所 以 发 展 非常 迅速 ， 显 示 出 其 强大 的 生命 力 。 

智能 机 器 人 按照 智能 化 程度 的 高 低 ， 可 以 分 为 外 部 受 控 机 器 人 、 半 自主 机 器 人 和 全 自主 
机 器 人 。 从 行业 应 用 的 角度 来 讲 ， 机 器 人 可 分 为 工业 机 器 人 和 服务 娱乐 机 器 人 。 工 业 机 器 人 
包括 工作 在 点 焊 、 弧 焊 、 喷 漆 、 搬 运 、 码 霖 等 工业 现场 中 的 机 咒 人 。 在 不 同 的 应 用 场合 下 ， 
又 有 水 下 机 器 人 ， 空 间 机 器 人 和 农业 、 林 业 、 牧 业 、 医 用 机 器 人 等 。 按 移动 机 器 人 的 运 动 方 
式 ， 机 器 人 又 可 分 为 轮 式 移动 机 器 人 、 步 行 移动 机 器 人 、 履 带 式 机 器 人 、 疏 行 式 机 器 人 和 空 
气 推进 、 水 下 推进 机 右 人 等 。 

目前 ， 尽 管 智能 机 需 人 的 研究 取得 了 显著 的 成 绩 ， 但 控制 论 专家 们 认为 它 可 以 具备 的 智 
能 水 平 的 极限 并 未 达到 。 问 题 不 只 在 于 计算 机 的 运算 速度 不 够 和 感知 传 感 锅 种 类 少 ， 而 且 在 
于 其 他 方面 ， 如 缺乏 编制 机 器 人 理智 行为 程序 的 设计 思想 等 。 

10. 数据 挖掘 与 知识 发 现 (Data Mining &Knowledge Discovering ) 

随 着 数据 库 技 术 的 成 熟 和 数据 应 用 的 普及 ， 人 类 积累 的 数据 量 正在 以 指数 速度 迅速 增 
长 。 但 是 浩瀚 无 塌 的 信息 海洋 ， 数 据 洪 水 正 向 人 们 滚滚 涌 来 。 当 数据 量 极度 增长 时 ， 如 果 没 
有 有 效 的 方法 提取 有 用 的 信息 和 知识 ， 人 们 处 理 问 题 时 会 像 大 海 捞 针 一 样 。 相 对 于 “数据 
过 剩 ” 和 “信息 爆炸 ”， 人 们 反 会 感到 信息 贫乏 。 于 是 数据 挖掘 与 知识 发 现 就 应 运 而 生 ， 帮 
助人 们 在 数据 汪洋 中 去 粗 存 精 、 去 伪 存 真 。 

数据 挖掘 就 是 从 大 量 的 、 不 完全 的 、 有 噪声 的 、 模 糊 的 、 随 机 的 数据 中 ， 提 取 隐 含 在 其 中 
的 、 人 们 事先 不 知道 的 但 又 是 潜在 有 用 的 信息 和 知识 的 过 程 。 数 据 挖掘 提取 的 知识 可 以 表示 为 
概念 、 规 律 、 模 式 、 约 束 、 可 视 化 。 数 据 挖掘 算法 的 好 坏 将 直接 影响 所 发 现 知识 的 好 坏 。 

知识 发 现 是 所 谓 数据 挖掘 的 一 种 更 广义 的 说 法 ， 即 从 各 种 媒体 表示 的 信息 中 ， 根 据 不 同 
的 需求 获得 知识 。 知 识 发 现 的 目的 是 向 使 用 者 屏蔽 原始 数据 的 繁琐 细节 ， 从 原始 数据 中 提炼 
出 有 意义 的 、 简 洁 的 知识 ， 直 接 向 使 用 者 报告 。 

知识 发 现 过 程 由 以 下 三 个 阶段 组 成 : 中 数据 准备 ; @ 数 据 控 掘 ;，@) 结 果 表 达 和 解释 。 

目前 ,数据 挖掘 和 知识 发 现 的 应 用 十 分 广泛 。 政 府 管理 、 商 业经 营 、 工 业 企业 决策 文 
持 、 市 场 销售 预测 、 金 融 投资 、 社 会 保险 、 医 学 、 天 文 、 地 质 以 及 科学 研究 等 各 个 领域 都 会 
用 到 数据 挖 气 和 知识 发 现 技术 。 



























































习 题 


能 有 
9 能 的 主要 研究 内 容 有 哪些 ? 
9 能 的 主要 应 用 领域 有 哪些 ? 


第 2 章 
知识 表示 和 推理 


全 


知识 及 推理 是 智能 的 基础 。 人 类 的 主要 智能 活动 就 是 获取 知识 ， 并 进行 基于 知识 的 推 
理 。 为 了 使 机 器 具有 智能 ， 就 必须 让 它 拥 有 知识 ， 并 完成 基于 知识 的 推理 。 西 蒙 于 1976 年 
提出 了 著名 的 物理 符号 系统 (PSSH) 假说 ， 指 出 知识 的 基本 元 素 是 符号 ， 智 能 的 基础 依赖 
于 知识 。 专 家 系统 就 是 一 类 包含 知识 库 和 推理 机 的 智能 计算 机 程序 ， 正 是 其 蕴含 了 领域 专家 
的 经 验 和 知识 ， 才 具有 了 解决 专门 问题 的 能 力 。 不 同 于 符号 主义 对 知识 的 显示 表示 ， 联 结 主 
义 从 微观 功能 和 结构 上 对 人 脑 结 构 进 行 抽象 和 简化 ， 通 过 并 行 信息 人 处理 ， 来 模拟 人 类 智能 ， 
联结 主义 所 设计 的 网 络 中 ， 知 识 采用 隐 式 的 方式 进行 表示 ， 即 将 某 一 问题 的 若干 知识 在 同一 
网 络 中 进行 表示 。 

人 们 和 希望 对 人 类 智能 行为 的 描述 通过 计算 机 来 完成 。 在 此 意义 下 ， 就 需要 将 知识 用 适当 
的 形式 表示 并 存储 到 计算 机 中 ， 即 所 谓 知识 的 表示 问题 。 并 且 为 了 使 计算 机 能 够 实现 辨识 、 
分 类 和 解释 等 过 程 ， 还 要 使 其 具有 思维 能 力 ， 即 所 谓 的 能 够 运用 知识 求解 问题 ， 完 成 推理 


过 程 。 


















































2.1 知识 和 知识 表示 的 基本 概念 


1. 知识 

关于 “知识 ”的 定义 ， 不 同学 科 和 理论 体系 看 法 不 同 。 在 心理 学 上 ， 将 个 体 通 过 与 环 
境 相 互 作用 后 获得 的 信息 及 其 组 织 定义 为 知识 。 而 在 一 般 意 义 上 ， 知 识 可 理解 为 人 们 对 客观 
事物 及 其 规律 的 认识 。 

纵横 古今 ， 不 乏 关 于 “知识 ”的 名 言 。 英 国 哲 学 家 培根 (Bacon) 曾 说 过 : “Knowledge 
is power”， 人 工 智 能 大 师 费 根 饱 姆 (Feigenbaum) 有 一 句 关 于 知识 的 名 言 : “In the 
Knowledge lies the power”。 美 国 思想 家 爱 默 生 (Emerson) 认为 : “Knowledge is the fear of 
drug treatment”。 英 国 哲学 家 赫 ， 斯 宾 塞 (Hesibinse) 谈 到 : “Science is systematized knowl- 
edge”; 在 我 国 ， 早 在 东汉 时 期 ， 大 思想 家 王充 在 其 《 论 衡 . 效力 》 中 就 曾 指出 : “人 有 知 
学 ， 则 有 力 矣 ”; 我 国 宋代 理学 家 朱 喜 也 认为 : “当务之急 ， 不 求 难 知 ; 力行 所 知 ， 不 眉 所 
难为 ”。 

在 人 工 智能 领域 ， 关 于 知识 ， 比 较 有 代表 性 的 定义 有 : 

Feigenbaum:， 知识 是 经 过 裁剪 、 塑 造 、 解 释 、 选 择 和 转换 了 的 信息 ; 

Bernstein: 知识 由 特定 领域 的 描述 、 关 系 和 过 程 组 成 ; 

Heyes-Roth: 知识 = 事实 + 信念 + 启发 式 。 
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一 般 来 说 ， 人 工 智能 领域 中 知识 的 含义 是 指 把 有 关 信 息 关联 在 一 起 所 形成 的 信息 结构 。 
言 息 之 间 的 关联 形式 有 多 种 ， 例 如， 信息 之 间 某 种 因果 关系 的 关联 形式 可 表示 为 “如 
果 …… ， 那 么 ……?”。 比 如 ， 在 北方 ， 当 冬天 来 临时 ， 大 雁 就 会 向 南方 飞 去 。 这 样 ， 将 “大 
雁 向 南 飞 ”和 “冬天 来 临 了 ”两 个 信息 按照 因果 关系 进行 关联 ， 即 可 得 到 “如 果 大 雁 向 南 
飞 ， 那 么 冬天 来 临 了 ”这 样 的 知识 。 这 样 关联 起 来 所 形成 的 知识 也 成 为 “规则 ”。 

通常 ， 知 识 具 有 相对 正确 性 、 不 确定 性 、 可 表示 性 以 及 可 利用 性 等 特点 。 

相对 正确 性 是 指 知识 必须 是 在 特定 条 件 和 特定 环境 下 才 是 正确 的 。 例 如 ,“1+1=2” 是 
在 满足 十 进 制 运 算 的 条 件 下 才 是 正确 的 ， 如 果 是 其 他 进 制 的 运算 ， 则 不 一 定 正 确 。 在 人 工 智 
能 领域 中 ， 为 了 提高 计算 效率 ， 通 党 根据 实际 问题 的 需求 ， 减 少 不 必 要 的 知识 规则 ， 此 时 ， 
知识 的 正确 性 只 要 满足 所 求解 问题 的 需求 即 可 。 例 如 ， 某 小 型 动物 园 中 只 有 “狮子 、 老 虎 、 
豹子 、 熊 、 鹿 、 狐 狸 、 企 牧 、 锡 岛 、 信 天 全 ”等 几 种 有 限 的 动物 ， 那么 ,，“1IF 该 动物 会 飞 ， 
THEN 该 动物 是 信和 天 全 ”这 条 知识 就 是 正确 的 。 

知识 的 不 确定 性 是 指 知识 由 于 存在 一 定 的 模糊 性 和 随机 性 ， 从 而 造成 不 一 定 只 有 “ 真 ” 
和 “ 假 ” 两 种 确定 状态 。 例 如 ,“ 如 果 流 鼻涕 、 头 疼 、 发 伐 ， 则 可 能 感冒 了 ”这 条 知识 中 的 
“有 可 能 ”就 是 一 种 不 确定 性 因果 关系 的 表达 。 在 现实 址 界 中 ,许多 事件 自身 就 是 随机 事 
件 ， 例如， 掉 落 在 地 面 上 的 硬币 的 朝向 。 还 有 些 概 念 客观 存在 模糊 性 ， 例 如 ,“ 大 苹果 ” 
“比较 好 ” “寒冷 的 天 气 ” 等 。 因 此 ， 事 件 发 生 的 随机 性 、 概 念 的 模糊 性 可 以 引起 知识 的 不 
确定 性 。 另 外 ， 知 识 一 般 是 由 特定 领域 的 专家 提供 的 ， 而 专家 的 知识 具有 经 验 性 ， 经 验 性 本 
吴 就 理 含 着 模糊 性 和 不 精确 性 。 同 时 ， 人 类 对 客观 地 界 的 认识 是 通过 感性 认识 的 逐渐 积累 ， 
慢 慢 升华 到 理性 认识 ， 并 形成 知识 。 因 此 ， 知 识 具 有 逐渐 完善 的 特点 ， 也 就 是 人 们 对 知识 的 
表述 具有 不 完全 性 和 不 准确 性 ， 这 也 导致 了 知识 的 不 确定 性 。 因 此 ， 专 家 的 经 验 性 以 及 人 们 
认识 知识 的 不 完全 性 也 会 引起 知识 的 不 确定 性 。 
另外， 知识 必须 能 够 以 某 种 适当 的 形式 进行 表示 ， 这 样 才 能 够 被 存储 、 记 忆 、 传 播 和 利 
而 知识 的 可 利用 性 是 指 只 有 可 以 被 利用 ， 知 识 才 能 够 用 于 解决 各 种 工程 或 实际 问题 。 
按照 不 同 的 规则 ， 知 识 可 以 从 多 个 角度 进行 分 类 。 
(1) 按 作用 范围 分 ， 知 识 可 分 为 常识 性 知识 和 领域 性 知识 。 
第 识 性 知识 泛 指 普遍 存在 且 被 普遍 认识 了 的 客观 事实 ， 即 人 们 的 共有 知识 。 如 : 在 候 机 
厅 ， 持 登 机 牌 乘机 ;春天 大 地 复苏 ; 适当 的 体育 锻炼 有 益 身 体 健康 等 。 

领域 性 知识 特 指 某 个 具体 领域 的 知识 ， 如 数学 、 自 然 科 学 、 人 文科 学 等 特定 领域 的 专门 
知识 ， 只 有 该 领域 的 专业 人 员 才 能 掌握 和 运用 的 知识 。 如 : 对 偶 四 元 数 由 对 偶数 和 对 偶 向 量 
组 成 、 经 典 控制 包括 开 环 控制 和 确定 性 反馈 控制 、1CB = 1024MB 等 。 

(2) 按 作用 及 表示 分 ， 知 识 可 分 为 事实 性 知识 、 过 程 性 知识 和 控制 性 知识 。 

事实 性 知识 又 称 叙述 性 知识 (Declarative Knowledge) ， 是 描述 客观 事物 或 问题 的 概念 、 
性 质 、 关 系 及 条 件 等 情况 的 知识 。 如 圆 的 周 长 为 2rR (R 为 圆 的 半径 )、 一 天 是 24 个 小 时 、 
海水 是 咸 的 、 吉 林 省 位 于 我 国 东 北 地 区 等 ， 其 表示 方法 主要 有 “命题 ”或 “一 阶 谓词 ” 形 
式 等 。 在 知识 库 中 属于 最 底层 知识 。 

过 程 性 知识 (Procedural Knowledge) 是 有 关系 统 过 程 变化 、 问 题 求解 过 程 的 操作 、 演算 
和 行动 的 知识 。 一 般 由 与 所 求解 的 问题 有 关 的 规则 、 定 律 、 定 理 及 经 验 构 成 。 其 表示 方法 主 
要 有 “产生 式 规则 ”“ 语 义 网 络 ” 等 。 
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控制 性 知识 又 称 元 知识 (MetaKnowledge) 或 超 知识 。 元 (Meta) 表示 “在 其 中 ， 在 之 
后 ”之 义 ， 故 为 关于 知识 的 知识 ， 是 知识 库 中 的 高 层 知识 。 例 如 ,问题 求解 中 的 推理 策略 
( 正 向 推理 、 逆 向 推理 、 双 向 混合 推理 ) 、 不 确定 的 推理 策略 (主观 Bayes、 可 信和 度 、D-S 理 
论 ) 等 。 

例如 ， 学 生 结 束 “ 人 工 智 能 ”课程 后 ， 考 试 是 早 些 考 还 是 晚 些 考 问题 。 有 关 的 知识 
如 下 : 

叙述 性 知识 :“ 人 工 智 能 ”课程 、 考 试 、 早 些 、 晚 些 。 

过 程 性 知识 : 早 些 考 、 晚 些 考 。 

控制 性 知识 : 时 考 较 前 进行 ,复习 时 间 不 充足 ; 晚 考 较 后 进行 ， 容 易 遗 忘 。 

(3) 按 确定 性 程度 分 ， 知识 可 分 为 确定 性 知识 和 不 确定 性 知识 。 

确定 性 知识 就 是 真 值 为 “ 真 ”或 “ 假 ” 的 知识 ， 可 以 精确 表示 的 知识 。 

不 确定 知识 就 是 经 验 的 、 直 觉 的 或 启发 性 的 知识 。 这 种 不 确定 性 体现 为 多 种 多 样 的 ， 具 
有 随机 性 、 模 糊 性 等 。 前 者 可 以 通过 概率 理论 描述 ， 后 者 可 以 通过 模糊 理论 描述 。 

(4) 按 知 识 的 层次 分 ， 知识 可 分 为 表层 知识 和 深层 知识 。 

表层 知识 是 指 客观 事实 的 表象 及 其 结构 之 间 的 关系 ,其 不 能 反映 事物 的 本 质 ， 如 经 验 性 
知识 、 感 性 知识 。 目 前 ， 绝 大 多 数 专 家 系统 所 拥有 的 知识 都 是 表层 知识 。 如 : IF 炉 温 偏 低 
AND 温度 变化 的 系数 为 负 ，THEN 增加 燃料 量 ， 属 于 经 验 性 的 知识 。 树 木 发 出 新 芽 ， 则 春天 
来 了 ， 属 于 感性 认识 。 

深层 知识 是 事物 的 本 质 、 因 果 关 系 的 内 涵 、 基 本 原理 等 类 型 的 知识 。 如 理论 知识 、 理 性 
知识 。 如 : 牛顿 第 二 定律 、 万 有 引力 等 。 

还 有 一 些 分 类 方法 ， 如 : 就 表现 形式 而 言 ， 知 识 分 为 逻辑 性 知识 和 形象 性 知识 ; 就 内 容 
而 言 ， 知 识 可 分 为 〈 客 观 ) 原理 性 知识 和 ( 主观) 方法 性 知识 ; 就 形式 而 言 ， 知 识 可 分 为 
显 式 和 隐 式 的 。 按 现代 认 知 心理 学 的 理解 ,知识 还 有 广义 和 狭义 之 分 。 广 义 知 识 又 可 分 为 陈 
述 性 知识 和 程序 性 知识 。 在 此 ， 不 再 累 述 。 

2. 知识 的 表示 

知识 表示 (Knowledge Representation) 是 人 工 智 能 研究 中 最 活跃 的 领域 。 它 是 将 人 类 知 
识 形 式 化 或 者 模型 化 ， 实 际 上 就 是 对 知识 的 一 种 描述 ， 或 者 说 是 一 组 约定 ， 一 种 计算 机 可 以 
接受 的 用 于 描述 知识 的 数据 结构 。 

正如 前 面 所 述 ， 符 号 主义 倡导 知识 的 “符号 表示 法 ”， 用 各 种 不 同 的 方式 和 次 序 将 各 种 
含有 具体 含义 的 符号 组 合 起 来 表示 知识 ， 是 一 种 显 式 表示 法 。 如 : 英文 单词 、 数 学 公式 中 的 
字母 或 化 学 方程 式 的 符号 等 ;“ 连 接 机 制 表示 法 ”主要 采用 神经 网 络 技术 ， 将 各 种 含有 具体 
意义 的 信息 通过 不 同 的 方式 或 次 序 连 接 起 来 ， 以 此 表示 知识 ， 是 一 种 隐 式 表示 法 。 

总 结 起 来 ， 知 识 表示 方 法 应 遵循 的 原则 包括 : 

(1) 充分 表示 领域 知识 ; 

(2) 有 利于 对 知识 的 利用 ; 

(3) 便于 对 知识 的 组 织 、 维 护 和 管理 ; 

(4) 便于 理解 与 实现 。 

目前 ， 比 较 常 用 的 知识 的 表示 方法 有 10 余 种 ， 主 要 为 一 阶 谓 词 逻 辑 ( First-order 
Predicate Logic) 表示 法 、 产 生 式 (Production) 表示 法 、 框 架 (Frame) 表示 法 、 语 义 网 络 
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(Semantic Web) 表示 法 、 过 程 (Procedural) 表示 法 、 脚 本 (剧本 ，Script) 表示 法 、 状 态 
空间 (State Space) 表示 法 和 面向 对 象 (Object-oriented) 的 表示 法 等 。 

对 于 同一 个 知识 ， 可 以 用 不 同 的 方法 对 其 表示 ， 有 时 还 需要 将 几 种 表示 方法 融合 使 用 ， 
作为 一 个 整体 来 表示 领域 知识 。 以 下 重点 探讨 经 典 二 值 逻辑 中 命题 逻辑 、 一 阶 谓 词 逻辑 的 话 
法 和 语义 。 


2.2 命题 逻辑 


人 工 智能 中 用 到 的 逻辑 可 划分 为 两 类 : 一 类 是 经 典 二 值 逻 辑 ， 特 指 命题 逻辑 或 一 阶 谓词 
逻辑 ， 其 真 值 或 者 为 真 (True) 或 者 为 假 (False) ， 再 无 其 他 ; 另 一 类 泛 指 经 典 二 值 逻 辑 之 
外 的 那些 逻辑 ， 主 要 包括 三 值 逻辑 、 多 值 逮 辑 〈 多 于 两 个 可 能 真 值 ) 、 模 糊 惕 辑 (多 值 逻辑 
的 扩展 ) 、 模 态 逻 辑 、 时 态 逻 辑 等 ， 统 称 为 非 经 典 逻 辑 。 

所 谓 命题 就 是 具有 真 假意 义 的 陈述 句 。 因 此 ， 要 判断 一 个 句子 是 否 是 命题 ， 首 先 应 该 判 
断 它 是 否 是 陈述 句 ， 再 判断 它 是 否 有 唯一 的 真 值 。 若 命题 的 意义 为 真 ， 称 它 的 真 值 为 真 ， 记 
作 了 (True)。 例 如 ,“ 英 语 是 国际 官方 语言 “水 是 生命 之 源 ”， 真 值 为 7; 若 命题 的 意义 为 
假 ， 称 它 的 真 值 为 假 ， 记 作 正 (Fake) 。 例 如 ,， “太阳 从 西边 升 起 ”“ 北 京 是 个 沿海 城市 ” 
“一 斤 铁 要 重 于 一 厂 棉花 ”， 真 值 为 F。 

一 个 命题 的 真 值 为 真 或 者 为 假 是 互 斥 的 关系 ,不 能 同时 存在 ， 但 可 以 在 一 定 条 件 下 为 
真 ， 在 另 一 条 件 下 为 假 。 例 如 , “1+1=10” 在 二 进 制 系统 中 是 真 值 为 了 的 命题 ， 但 在 十 进 
制 系统 中 是 真 值 为 太 的 命题 。 

注意 , 我们 这 里 关于 命题 的 定义 ,不 包含 “ 悖 论 (Paradox) ”或 “ 自 指 ” 的 情况 。 
“我 在 说 谎 ” 是 古 希 腊 最 早 的 悖 论 ， 如 果 他 在 说 谎 ， 那 么 “我 在 说 谎 ” 就 是 一 个 谎 ， 因 此 他 
说 的 是 实话 ， 但 是 如 果 这 是 实话 ， 他 又 在 说 谎 ， 矛 盾 在 此 不 可 避免 。 其 另 一 个 翻版 是 “这 
句 话 是 错 的 ”。 

我 们 再 来 看 它 的 一 个 通俗 版 本 ， 叫 “理发 师 导论 ”。 在 一 个 小 镇 内 ， 只 有 一 名 理发 师 ， 
他 在 理发 店 门 外 公 布 了 这 样 一 个 原则 : 只 为 不 会 自己 理发 的 人 理发 。 那 么 ， 问 题 出 现 了 ， 他 
的 头发 谁 理 呢 ? 要 是 他 自己 理 的 话 ， 他 就 会 自己 理发 了 ， 而 根据 他 的 原则 ， 他 不 应 该 为 自己 
理发 ; 要 是 他 不 给 自己 理发 的 话 ， 根 据 他 的 原则 ， 他 倒是 应 该 给 自己 理发 。 逻 辑 似 乎 在 这 里 
失效 了 。 所 以 ， 像 这 类 的 句子 都 不 是 命题 。 

实际 上 ,“ 悖 论 ” 是 属于 领域 广阔 、 定 义 严 格 的 数学 分 支 的 一 个 组 成 部 分 ， 这 一 分 支 以 
“趣味 数学 ”知名 于 世 。 

命题 逻辑 是 研究 命题 与 命题 之 间 关 系 的 符号 (Symbol) 逻辑 系统 ， 通 常用 大 写字 母 P、 
Q 等 表示 。 如 : 

P: 重庆 是 一 个 直辖 市 。 

P 就 表示 “重庆 是 一 个 直辖 市 ”这 个 命题 的 名 ， 称 为 命题 常量 。 也 可 以 是 一 个 抽象 的 
命题 ， 称 为 命题 变 元 ， 只 有 把 确定 的 命题 代入 后 ， 它 才 有 明确 的 真 值 。 


2.2.1 语法 
命题 可 划分 为 两 种 类 型 ,一 是 不 能 再 进行 分 解 的 最 简单 的 陈述 句 (最 小 单位 )， 称 为 
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“原子 命题 ” 。 二 是 由 原子 命题 、 连 接 词 、 一 系列 标点 符号 等 复合 构成 的 命题 ， 以 表示 一 个 
比较 复杂 的 含义 ， 称 为 “复合 命题 ”。 

1. 连接 词 

命题 逻辑 主要 使 用 以 下 5 个 连接 词 ， 分 别 为 1 个 一 元 连接 词 和 4 个 二 元 连接 词 。 

(1) ” : 称 为 “和 否定 ” (Negation) 或 “ 非 ”。 表 示 否 定位 于 它 后 面 的 命题 。 当 命题 P 
为 真 时 ， -~ 尸 为 假 ; 当 己 为 假 时 ，” PP 为 真 。 

(2) V : 称 为 “ 析 取 ” (Disjunction ) 。 表 示 所 连接 的 两 个 命题 具有 “或 ” (or) 的 关 
系 。 记 作 “PVO"”。 

(3) 和 人: 称 为 “ 合 取 ”(Conjunction) 。 表 示 所 连接 的 两 个 命题 具有 “与 ”(and) 的 关 
系 。 记 作 “PAQ”。 

(4) 一 : 称 为 “ 斑 售 ” (Implication) 或 者 “条 件 ”( Condition)。 记 作 “P 一 0”， 表 
示 “P 强 含 0”， 即 “如 果 P,， 则 0”。 其 中 , P 称 为 条 件 的 前 件 ， 又 称 前 项 
(Antecedent)、 左 部 、 前 提 条 件 (Premise ); 0 称 为 条 件 的 后 件 ， 又 称 后 项 
(Consequent) 、 右 部 、 结 论 (Conclusion)。 今后 我 们 将 不 加 区 分 地 使 用 这 些 术 语 , 不 再 做 
单独 说 明 。 这 里 , “蕴含 ”与 汉语 中 的 “如 果 …… ， 则 ……. ”有 有 区别， 汉语 中 前 后 要 有 条 
件 联系 ， 而 命题 中 可 以 毫 无 联系 。 例 如 ， 如 果 “ 你 是 教师 ”， 则 “秋天 是 收获 的 季节 ”是 
一 个 真 值 为 真 (7) 的 命题 。 

(5) 收 : 称 为 “等 价 ”(Equivalence) 或 “ 双 条 件 ” (Bicondition ) 。P*>O 表示 “P 当 
且 仪 当 0”。 例如,“ 我 在 中 国 ， 当 且 仪 当 我 的 头 在 中 国 ”。 

2. 命题 逻辑 合成 公式 (Well-Formed Formulas，WFF) 

可 按 下 述 规 则 得 到 命题 逻辑 合成 公式 : 

(1) 任何 原子 命题 都 是 命题 逻辑 合成 公式 ; 

(2) 若 P 是 命题 逻辑 合成 公式 ， 则 -PP 也 是 命题 逻辑 合成 公式 ; 

(3) 若 P、0 是 命题 逻辑 合成 公式 ， 则 PV OQ、PAQ、P 一 0 及 P00 也 是 命题 逻辑 合 
成 公式 ; 

(4) 经 过 有 限 次 的 使 用 (1) 、(2) 和 (3) ， 得 到 的 由 原子 命题 、 连 接 词 和 括号 所 组 成 
的 符号 串 ， 也 是 命题 逻辑 合成 公式 。 

在 命题 逻辑 合成 公式 中 ， 连 接 词 的 优先 级 别 (从 高 到 低 ) 是 : 

AV 


如 句子 P=- 0QmSAT 等 价 于 (P 一 (=-0)) 呈 (SA7) 





























2.2.2 语义 (Semantics ) 


语法 中 所 定义 的 连接 词 的 语义 定义 如 下 : 

(1) -了 为 真 ， 当 日 仅 当 PP 为 假 ; 

(2) PVQ 为 真 ， 当 且 仅 当 P 为 真 , 或 0 为 真 , 或 P 和 0 均 为 真 ; 

(3) PAQ 为 真 ， 当 且 仅 当 P 和 0 均 为 真 ; 

(4) P 一 0 为 真 ， 当 日 仅 当 P 和 0 均 为 真 、 或 P 为 假 ，0 为 真 、 或 P 为 假 ，0 为 假 ; 
(5) PO， 当 旦 仅 当 P 一 0 为 真 ， 并 且 0 一 P 为 真 。 

上 述 关 系 的 真 值 表 (Truth table) 如 表 2-1 所 示 。 
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表 2-1 命题 逻辑 真 值 表 





P Q -P PVQ PAQ P_O Po0 
7 F 7 六 
7 F F F F F 
F 7 7 7 F 家 F 
F F F F F 7 7 





注意 : 如 果 后 项 真 值 为 了 (不 论 其 前 项 的 真 值 如 何 ) ,或 者 前 项 真 值 为 r (不论 其 后 项 
真 值 如 何 ) ， 则 列 含 取 值 为 了， 否则 取 值 为 尺 。 即 只 有 前 项 为 了， 后 项 为 下 时 ， 列 仿真 值 才 
为 卫 。 


2.2.3 命题 演算 (Calculas) 形式 系统 


个 命题 符号 对 应 于 对 世界 的 一 种 陈述 。 为 命题 语句 赋 真 值 被 称 为 解释 
(Interpretation) ， 即 关于 它们 对 世界 的 一 个 断言 。 命 题 公式 中 各 个 命题 变 元 的 一 次 真 值 指派 
对 应 一 个 解释 ， 命 题 公 式 就 可 以 得 到 一 个 真 值 (7 或 FF)。 

【 例 2-1】 给 出 公式 G=(PV0Q) 一 (=-5) 的 一 个 解释 ， 并 给 出 该 公式 的 真 值 。 

对 集合 1P，@，S} 分 别 赋予 真 值 ， 如 集合 |f，F，7T| 就 是 对 公式 G6 的 一 个 解释 ， 
公式 C 共 有 CC C=8 种 解释 。 表 2-2 给 出 了 公式 6 全 部 8 种 解释 下 的 真 值 ， 称 为 C 的 
真 值 表 。 




















表 2-2 G 的 真 值 表 
P 0 S PVO -5 (PV0Q)—(- 5) 
下 了 了 了 F F 
了 了 F 了 了 了 
了 F 了 了 F F 
人 F F 了 了 了 
F 下 了 了 F F 
F 了 F 了 了 了 
F F 了 F F 了 
F F F F T 了 


在 命题 演算 中 ， 两 个 表达 式 P、0 等 价 的 条 件 是 对 于 任何 赋值 (任何 一 个 解释 ) ， 两 者 
真 值 均 相 同 ， 记 作 PeO@。 可 以 使 用 真 值 来 证 明 这 种 等 价 性 。 
对 于 命题 表达 式 P、O 和 尺 ， 以 下 列 出 一 些 主要 等 价 式 ; 
(1) 双重 否定 律 
nm POP 

(2) 德 . 摩根 (De. Morgen) 定律 

- (PVQO)S- PA-D 0 

- (PAQ)S- PV-O 0 
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(3) 逆 否 律 
也 一 0 全 ”0 一 一 卫 
(4) 连接 词 化 归 律 
P_ 0Ocn PVO 
POP 一 0O) A (OPOP) 
Poe>0Oe(PAO)V(nPAn 0) 
(5) 吸收 律 
PV (PAQO)SP 
PA(PVO)SP 
(6) 补 余 律 
PV- POT( 真 ) 


PA-~- PeEF( 假 ) 
(7) 交换 律 
PVOcs>OVP 
PAOSsOAP 
(8) 结合 律 
(PVQO)VREOPV(QOVR) 
(PAQ) AREOPA(QOAR) 
(9) 分 配 律 
PV(QAR)SO(PVO)A(PVR) 
PA(QVR)SO(PAQ)V(PAR) 
可 以 利用 上 述 等 价 表达 式 把 命题 演算 变换 成 语法 不 同 ， 但 逻辑 等 价 的 形式 。 也 可 以 利用 
这 些 等 价 式 代替 真 值 来 证 明 两 个 表达 式 的 等 价 性 。 
诚然 ， 命题 逻辑 表示 法 存在 很 大 的 局 限 性 ， 如 ， 若 了 、0Q 表示 某 种 复杂 度 的 命题 ， 我 们 
无 法 访问 断言 的 各 个 部 分 。 例 如 ,希望 不 再 利用 一 个 符号 P 表示 “星期 天 去 扑 山 ”， 而 是 创 
建 一 个 谓词 Climb (Mountain， Sunday) 描述 动作 、 对 象 和 时 间 的 关系 ， 从 此 可 以 通过 推理 
规则 操纵 谓词 演算 表达 式 ， 访 问 它 的 每 个 组 成 部 分 ， 进 一 步 推理 出 新 的 语句 。 
同时 ,命题 逻辑 不 能 将 所 描述 事物 的 结构 或 逻辑 特征 表示 出 来 ， 亦 不 能 将 不 同事 物 
的 共同 特征 表述 出 来 。 如 , “西蒙 是 费 根 鲍 姆 的 老师 ”用 一 个 字母 P 表示 时 ， 不 能 体现 两 
人 的 师 生 关系 ,又 如 “西蒙 是 图 灵 奖 得 主 "”“ 费 根 鲍 姆 也 是 图 灵 奖 得 主 ” 这 两 个 命题 ， 若 
用 字母 P、0 分 别 表示 ， 也 无 法 将 两 人 的 共同 特征 (都 是 图 灵 奖 得 主 ) 从 形式 上 表示 出 
来 。 同 时 ， 谓 词 逻 辑 还 允许 含有 变量 ( 见 谓词 逻辑 )。 正 是 基于 这 些 原因 ， 在 命题 逻辑 的 
基础 上 发 展 起 来 了 谓词 逻辑 ， 成 为 AI 中 知识 表示 的 方法 中 研究 得 最 深入 、 理 解 得 最 全 面 
的 方法 。 


2.3 谓词 逻辑 


谓词 逻辑 以 数理 逻辑 为 基础 ， 是 可 以 准确 表达 人 类 思维 和 推理 的 形式 语言 。 谓 词 逻 辑 的 
表现 方式 与 人 类 语言 十 分 接近 ， 并 能 被 计算 机 精确 推理 。 谓 词 逻 辑 是 基于 命题 逻辑 中 谓词 分 
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析 的 一 种 逻辑 。 
2.3.1 语法 


一 个 谓词 (Predicate) 可 分 为 谓词 名 与 个 体 两 个 部 分 。 个 体 表 示 某 个 独立 存在 的 事物 或 
者 某 个 抽象 的 概念 ;谓词 名 用 于 刻画 个 体 的 性 质 、 状 态 或 个 体 间 的 关系 。 
谓词 的 一 般 形 式 为 : 





P(x1,%2, ,Nn) 

其 中 , P 是 谓词 名 ，x| ，x,，…，%, 是 个 体 ， 其 个 数 称 为 谓词 的 元 数 。P(x) 是 一 元 谓 
词 ，P(x，y) 是 二 元 谓词 ，P(xj ，x,，…，Xx,) 则 是 n 元 谓词 。 

谓词 名 是 由 使 用 者 根据 需要 人 为 定义 的 ， 一 般 选 用 有 意义 的 英文 单词 表示 ， 或 者 英文 大 
写 缩 写 ， 也 可 以 采用 其 他 符号 ， 其 至 可 以 是 中 文 。 如 ， 使 用 谓词 IT(Andrew, Mary) 和 Likes 
(Andrew，Mary) 用 来 表示 “安德鲁 喜欢 玛丽 ”在 形式 上 是 等 价 的 ， 只 不 过 后 者 更 有 助 于 指 
出 表达 式 的 含义 。 又 如 ， 谓 词 7T(Zhang) 表示 “Zhang 是 一 个 老师 ”， 也 可 以 定义 为 Teacher 
(Zhang )。 

对 于 “西蒙 是 图 灵 奖 得 主 ”“ 费 根 鲍 姆 也 是 图 灵 奖 得 主 ” 这 两 个 命题 ， 可 建立 谓词 
Turing (Simon) 、Turing (Feigenbaum)。 其 中 ，Turing 是 谓词 名 ，Simon 和 Feigenbaum 都 是 
个 体 。“Turing” 刻 画 了 “Simon” 和 “Feigenbaum” 是 图 灵 奖 得 主 的 共同 特性 。 

在 谓词 逻辑 中 ,个 体 可 以 是 一 个 常量 (Constant)， 也 可 以 是 一 个 变 元 (Variable)， 亦 
可 为 一 个 函数 (Function ) 。 

当 个 体 是 一 个 常量 时 ， 表 示 指 定 的 一 个 或 者 一 组 个 体 。 如 , “5>3” 可 以 表示 为 二 元 谓 
词 Creater(5，3) ， 其 中 的 5 和 3 就 是 个 体 。 

当 个 体 是 变 元 时 ， 表 示 尚 无 指定 的 一 个 或 者 一 组 个 体 。 如 , “5<x” 可 以 表示 为 Less (5， 
x) 。 其 中 ,x 就 是 变 元 。 当 变 元 被 一 个 具体 的 个 体 名 字 替 代 时 ， 即 被 常量 化 时 ,谓词 就 有 一 
个 确定 的 真 值 ，7 或 F。 

当 个 体 是 函数 时 ， 表 示 一 个 个 体 到 另 一 个 个 体 的 映射 。“ 我 的 父母 是 同学 ”可 表示 为 二 
元 谓词 Student (Father(1)，Mother(71) )。 其 中 ，Father(1) 和 Mother(1) 是 函数 。 

注意 : 尽管 与 谓词 形式 相 类 似 ， 这 里 Father(1) 和 Mother(1) 是 函数 ， 而 不 是 谓词 。 谓 
词 具有 真 值 (7 或 )， 而 函数 无 真 值 可 言 ， 只 是 每 个 输入 值 对 应 唯一 输出 值 的 一 种 对 应 
关系 。 

在 谓词 P(x; ，x,，…，x,) 中 , 若 每 一 个 x (=1，2，…， n) 都 是 个 体 变量 、 变 元 或 
基数 ， 称 其 为 一 阶 谓词 ( First-order Predicate ) 。 如 果 某 个 x; 本 身 又 是 一 个 一 阶 谓词 ， 则 称 
其 为 二 阶 谓词 ， 以 此 类 推 。 本 书 讨论 的 均 为 一 阶 谓词 ， 不 再 做 特殊 说 明 。 

1. 连接 词 

谓词 逻辑 中 所 使 用 的 连接 词 与 命题 逻辑 中 所 使 用 的 一 样 ， 下 面 ， 进 行 简单 举例 说 明 : 

(1) ~- : 称 为 “否定 ”(Negation) 或 “ 非 "。 表 示 否 定位 于 它 后 面 的 命题 。 

例如 ,“ 自 适应 控制 不 属于 经 典 控 制 ”， 可 表示 为 

— Belong( Adaptive control, Classic control) 

(2) V : 称 为 “ 析 取 ” (Disjunction)。 表 示 所 连接 的 两 个 命题 具有 “或 ” (or) 的 关 

系 。 记 作 “PV0”。 
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例如 , “Dennis 练 羽 毛 球 或 者 练 游泳 ”"， 可 表示 为 
Plays ( Dennis, badmintion) V Plays( Dennis, swimming ) 

(3) A: 称 为 “ 合 取 ”(Conjunction) 。 表 示 所 连接 的 两 个 命题 具有 “与 ”(and) 的 关 
系 。 记 作 “PAQ”。 

例如 , “George 是 公司 的 主席 和 经 理 ”， 可 表示 为 

Chief( George) NM Manager( George) 

也 可 以 表示 为 二 元 谓词 : 

Js-a( George ,chief) MJs-al George, manager ) 

(4) 一 : 称 为 “蕴含 ”(Implication) 或 者 “条 件 ” ( Condition)。 记 作 “P 一 0”， 表 示 
“PP 蕴含 0”， 即 “如 果 P， 则 0”。 

例如 ,“ 如 果 你 是 教师 ”， 则 “秋天 是 收获 的 季节 ”可 以 表示 为 

1s-al You ,teacher)—1s-al Autumn ,harvest season ) 

(5) 个: 称 为 “等 价 ”(Equivalence) 或 “ 双 条 件 ” (Bicondition ) 。P*>O 表示 “P 当 
且 仅 当 0"”。 

2. 量词 (Quantifier) 

为 刻画 谓词 和 个 体 间 的 关系 ， 在 谓词 逻辑 中 引入 了 两 个 量词 : 全 称 量词 ( Universal 
Quantifier) 和 存在 量词 (Existential Quantifier) 。 

(1) 全 称 量词 ， 表 示 “ 对 个 体 域 中 所 有 (或 任意 一 个 ) 个 体 x”, 记 作 “( Vx)”。 

例如 ,“ 所 有 的 客人 都 是 物理 老师 ”， 可 表示 为 

( Vx)|[ Quesi(%)—>Teacher(x,Physics) ] 
“每 一 条 河流 都 流向 低 处 ” ， 可 表示 为 
( Vx)[ River(x)—Flows(x%x,downwards) | 
“ 任 一 艺术 都 来 源 于 生活 ”， 可 表示 为 
(Vx)[Ari(x)—Form(x,real life) | 
(2) 存在 量词 ， 表 示 “ 在 个 体 域 中 存在 个 体 rz"， 记 作 “( 34)”。 
例如 ,“ 某 个 作家 要 来 这 ”， 可 表示 为 
( dx)[ Writer(%)—>Comel%,here) | 
“5 号 房间 里 有 个 物体 ”， 可 表示 为 
( 卫 x)7room(x,roomS) 

这 里 ，VY 和 后 面 的 x 叫做 量词 的 指导 变 元 或 作用 变 元 。 

全 称 量词 和 存在 量词 可 同时 出 现在 一 个 谓词 逻辑 中 。 这 时 ， 需 考虑 量词 的 辖 域 ( 详 见 
4)。 量 词 出 现 的 次 序 将 影响 谓词 逻辑 的 意思 。 例如， 设 一 元 谓词 P(x) 表示 “x 是 舞蹈 机 器 
人 ”， 二 元 谓词 0(x,，y) 表示 “x 和 y 是 同事 ”， 则 

( Vx)P(x) 表示 个 体 域 中 所 有 都 是 舞蹈 机 器 人 。 

(Vx)(3y)O(x，y) 表示 对 个 体 域 中 所 有 个 体 x， 都 存在 个 体 y, x 与 y 是 同事 。 

(Vx)(VYVy)Q(x,，y) 表示 对 个 体 域 中 所 有 x 和 y, x 与 y 都 是 同事 。 

(3x) (Vy)Q(x,，y) 表示 在 个 体 域 中 存在 个 体 *， 与 个 体 域 中 所 有 个 体 y 都 是 同事 。 

(3 了 3x)(3y)O(x，y) 表示 对 个 体 域 中 存在 x 和 y, x 与 y 是 同事 。 

又 如 ， 设 一 阶 谓词 Teacher(x) 表示 “x 是 老师 ”，Student(y, x) 表示 “y 是 x 的 学 
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生 ”， 则 
( Vx)( 习 y)[ Teacher(x) 一 Student(y,x) ] 表示 “所 有 的 老师 都 有 一 个 学 生 ”。 
( 习 y) (Vx)[ Teacher(x) 一 Student(y,x) ] 表示 “有 一 个 人 是 所 有 老师 的 学 生 ”。 
3. 谓词 公式 
谓词 公式 的 概念 : 谓词 演算 由 谓词 符号 、 篆 量 符号 、 变 量 符 号 、 函 数 符号 以 及 括号 、 
号 等 一 串 按 一 定语 法 规则 组 成 的 字符 串 的 表达 式 。 可 递归 定义 如 下 : 
(1) 单个 谓词 是 谓词 公式 ， 称 为 原子 谓词 公式 ; 
(2) 若 P、0 是 谓词 公式 , 则 ” P、PAQO、PVQO、P-0、Pe0 都 是 谓词 公式 ; 
(3) 若 已 是 谓词 公式 ，x 是 任意 个 体 变 元 ,， 则 (Yx)P、( 3x) 已 是 谓词 公式 ; 
(4) 谓词 公式 由 有 限 次 地 应 用 (1) 、(2) 和 (3) 产生。 
在 谓词 公式 中 ， 连 接 词 的 优先 级 别 ( 从 高 到 低 ) 仍 是 
5 sx Ns Va 

















尚 





4. 量词 的 辖 域 

位 于 量词 后 面 的 单个 谓词 或 用 括号 括 起 来 的 谓词 公式 称 为 量词 的 辖 域 ， 辖 域内 与 量词 中 
同名 的 指导 变 元 〈 或 作用 变 元 ) 称 为 约束 变 元 ， 不 受 约束 的 变 元 称 为 自由 变 元 。 

例如 ， 





(Va) (P(x, 47y) (Q(x,y) R(x,Y) )) 

(Vx) 的 辖 域 为 (P(x,y) 一 ( 3y) (Q(x,y) 中 R(x,y) ))， 其 中 ,x 是 约束 变 元 ，P(x， 
y) 中 的 y 为 自由 变 元 ; ( 3y) 的 辖 域 为 (Q(x,y) 嘻 R(x,y))， -gy y 是 约束 变 元 ， 所 有 
x 都 是 约束 变 元 。 

又 如 

(Vz)((37y)(( A) (Pz,t) VQ, )) AR(z,y)) 

其 中 ，( Vz) 的 辖 域 为 (( 3y)((3t)(P(z,t) VQ(y,t)))AR(z,y)),， (3y) 的 辖 域 
为 (( 0)(P(z,t) VOY,t))),，(31) 的 辖 域 为 (P(z,t) VQ(y,t)),，z、y 与 1 均 为 约束 
变 元 。 

在 谓词 公式 中 ， 变 元 的 名 称 符号 是 无 关 紧 要 的 ， 可 以 将 其 改 为 另 一 个 名 称 符号 。 需 
要 注意 的 是 ， 0 元 更 名 时 ， 必 须 把 对 应 的 约束 变 元 都 改 为 统一 的 名 
字 ， 且 不 能 与 自由 变 元 同名 ; 当 对 量词 辖 域内 的 自由 变 元 更 名 时 ， 也 不 能 改 为 与 约束 变 元 相 
同 的 名 称 符号 。 如 对 谓词 公式 (3x) (P(x) 一 Q(y))， 可 改名 为 (3z)(P(z) 一 Q(t))， 这 
里 ,将 约束 变 元 x 改 为 了 z， 将 自由 变 元 y 改 为 了 1。 

5. 用 谓词 公式 表示 知识 

以 下 给 出 利用 谓词 公式 进行 知识 表示 的 一 般 步 又 : 

(1) 定义 谓词 及 个 体 ， 确 定 每 个 谓词 及 个 体 的 确切 定义 ; 

(2) 根据 要 表达 的 事物 或 概念 ， 为 谓词 中 的 变 元 赋 以 特定 的 值 ; 

(3) 根据 语义 用 适当 的 连接 符号 将 各 个 谓词 连接 起 来 ， 形 成 谓词 公式 。 

【 例 2-2】 用 谓词 公式 表示 以 下 一 组 知识 : 

(1) 人 人 爱 学 习 ; 

(2) 所 有 数 不 是 实数 就 是 虚数 ; 

(3) 有 的 人 喜欢 下 雪 ， 有 的 人 喜欢 下 雨 ， 有 的 人 则 既 喜 欢 下 雪 又 喜欢 下 两 ; 
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(4) 喜欢 表演 的 人 必然 喜欢 艺术 ; 
(5) 没有 人 喜欢 被 骗 。 
求解 
(1) 定义 谓词 : Man(x): x 是 人 ; 
Loves(x, y): x 爱 y; 
表示 为 : (Vx) (Man(%)—Loves(x,Learning)) 
(2) 定义 谓词 : N(x) : x 是 数 ; 
R(x) : x 是 偶数 ; 
1(x) : % 是 奇数 ; 
表示 为 : (Vx) (N(x)—R(x) VI(x)) 
(3) 定义 谓词 : Likes(x，Yy): x 言 欢 y; 
表示 为 : 
(dx) (Likes(x,snow)) V (jx)(Likes(x,rain)) V (jx) (Likes(x,snow) MLikes(x,rain) ) 
(4) 表示 为 : 



































(Vx) (Likes(x,acting) Likes(x,art)) 
(5) 表示 为 : 
- (dx)(Likes(x,PBeing cheated)) 


2.3.2 语义 


前 述 关 于 命题 逻辑 的 语义 ， 完 全 适用 于 一 阶 谓词 逻辑 ， 在 此 不 再 累 述 。 仅 给 出 以 下 重要 
概念 

1. 谓词 公式 的 等 价 性 

设 P、Q 是 两 个 谓词 公式 , D 是 它们 共同 的 个 体 域 ， 如果 对 D 上 的 任何 一 个 解释 ，P 和 
@ 都 有 相同 的 真 值 ， 则 称 公 式 P 和 0 在 D 上 是 等 价 的 ; 如 果 D 是 任意 个 体 域 , 则 称 P 和 0 
是 等 价 的 ， 记 作 Pe0。 

这 些 重要 的 等 价 式 和 命题 中 的 重要 等 价 式 相 同 ， 只 追加 以 下 等 价 式 。 

(1) 量词 转化 律 





- (dx)PEO( Vx)(- P) 
-7 (Vx)PO( jdx)(- P) 
(2) 量词 分 配 律 
2. 谓词 公式 的 解释 
前 面 已 经 提 到 ， 对 命题 中 各 个 一 次 真 值 指派 对 应 一 个 解释 ， 一 旦 命题 确定 
后 ， 恨 提 和 接 定义 训 可 以 求全 真 值 (了 或 卫 ) 。 在 谓词 逻辑 中 ， 由 于 公式 中 
存在 个 体 常量 、 个 体 变 元 和 函数 ， 不 能 直接 通过 真 值 指 派 给 出 解释 ， 必 须 首先 考虑 个 体 变量 
ee ee et et 
在 多 个 组 合 情 况 ， 因 此 一 个 谓词 公式 的 解释 可 以 是 多 个 ， 相 应 地 ， 对 应 一 个 解释 ， 谓 词 公式 
就 获得 一 个 真 值 (7 或 了 )。 
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【 例 2-3】 设 个 体 域 D=|1,2| ,已 知 谓词 公式 ( 3y)( Vx) (P(x,y) 一 0(x,y))， 请 给 
出 其 在 D 上 的 某 一 个 解释 ， 并 指出 在 此 解释 下 ， 该 谓词 公式 的 真 值 。 

对 于 此 谓词 公式 ， 由 于 存在 变 元 x、y 和 两 个 谓词 P(x,y) 和 Q(x,y) ,根据 个 体 域 D， 
对 两 个 谓词 指派 真 值 ， 设 真 值 如 下 : 

P(1,1)=F, P(1,2)=7, P(2,1)=F, P(2,2)=7 
Q(1,1)=7, 0(1,2)=F, 0Q(2,1)=F, 0(2,2)=7 

上 述 指 派 就 是 对 题目 中 给 出 的 谓词 公式 的 一 个 解释 ， 在 此 解释 下 

当 x=1, y=1 时 , 有 P(1, 1)=F,，Q(1, 1)=7, 则 P(x, y) 一 Q(x, y) 真 值 为 7; 

当 w=2, y=1 时 , 有 P(2, 1)=7,，0(2, 1)=F， 则 P(x, y) 一 0(x, y) 真 值 为 F; 

当 x=1, y=2 时 , 有 P(1, 2)=F，Q(1, 2)=， 则 P(x, y) 一 Q(x,y) 真 值 为 7; 

当 x=2, y=2 时 , 有 P(2, 2)=7,，0Q(2, 2)=7, 则 P(x, y) 一 0(x,y) 真 值 为 7; 

即 对 个 体 域 D 中 所 有 x， 存在 y 使 得 P(x，y) 一 Q(x，y) 的 真 值 为 7， 所 以 谓词 公式 
( 习 y)(Vx) (P(x,y) 一 0(x,y) ) 在 此 解释 下 的 真 值 为 7。 

3. 谓词 公式 的 永 真性 、 永 假 性 

如 果 谓 词 公式 P 对 个 体 域 D 上 的 任何 一 个 解释 都 取得 真 值 了 ， 则 称 了 在 D 上 是 永 真 的 ; 
如 果 P 在 每 个 非 空 个 体 域 上 均 永 真 ， 则 称 P 永 真 。 

相应 地 ， 如 果 谓 词 公 式 P 对 个 体 域 D 上 的 任何 一 个 解释 都 取得 真 值 ， 则 称 P 在 D 上 
是 永 假 的 ， 如 果 P 在 每 个 非 空 个 体 域 上 均 永 假 ， 则 称 卫 永 假 。 

可 见 ， 若 要 判定 某 个 谓词 公式 永 真 ， 必 须 对 每 个 个 体 域 上 的 每 个 解释 逐个 判定 。 当 解释 
的 个 数 为 无 限时 ， 公 式 的 永 真性 就 很 难 判定 了 。 

4. 谓词 公式 的 可 满足 性 、 不 可 满足 性 

对 于 谓词 公式 P， 如 果 至 少 存 在 一 个 解释 ,使 得 P 在 此 解释 下 的 真 值 为 7"， 则 称 公 式 P 
是 可 满足 的 ， 否 则 ， 称 公式 P 是 不 可 满足 的 。 

对 于 【 例 2-3】]， 训 词 公式 (7y)( Vx) (P(x%,y) 一 Q(x,y)) 是 可 满足 的 。 

5. 谓词 公式 的 永 真理 含 

设 P、0 是 两 个 谓词 公式 ,如果 P 一 0 永 真 ， 则 称 公式 P 永 真 蕴 含 0， 记 作 P 一 0， 且 称 
Q 为 P 的 逻辑 结论 , P 为 0 的 前 提 。 以 下 给 出 一 些 重要 永 真 强 合式: 

(1) 化 简 式 
































PAQP 

PAQ=0 
即 由 PAQ 为 真 ， 可 推出 P 了 为 真 ， 由 PAQ 为 真 ， 可 推出 0 为 真 。 
(2) 附加 式 

P 一 PVO 

QPVO 


即 由 P 为 真 ， 可 推出 PV O 为 真 ; 由 0 为 真 ， 可 推出 PV0O 为 真 。 
(3) 假 言 推理 











P,P—0=0 
即 由 PP 为 真 及 Po 为 真 ， 可 推出 0 为 真 。 例 如 . 
“如 果 % 是 金属 ， 则 % 能 导电 ”及 “ 银 是 金属 ”可 推出 “ 银 能 导电 ”的 结论 。 
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(4) 拒 取 式 推理 





- 0 ,P 一 0 一 ”也 

即 由 0 为 假 ， 及 P 一 0 为 真 ， 可 推出 P 为 假 。 例 如 . 

“如 果 下 雨 ， 则 地 上 就 湿 ”， 及 “地 上 不 湿 ” 可 推出 “没有 下 雨 ” 的 结论 。 

对 于 拒 取 式 推理 ， 要 注意 避免 两 类 错误 : 一 是 肯定 后 件 (0); 一 是 否定 前 件 (P) 。 肯 
定 后 件 是 指 ， 当 P 一 0 为 真 时 ,希望 肯定 后 件 0 为 真 ， 来 推出 前 件 P 为 真 。 对 于 本 例 ， 

Q 如 果 下 雨 ， 则 地 上 就 湿 ; 

@) 地 上 湿 了 (肯定 后 件 ) ; 

@ 所 以 , 下 雨 了 ; 

这 显然 是 错误 的 ， 因 为 地 上 湿 了 ， 可 以 是 酒水 了 。 

否定 前 件 是 指 ， 当 P 一 0 为 真 时 ,希望 否定 前 件 P， 来 推出 后 件 0 为 假 。 对 于 本 例 ， 

QD 如果 下 雨 ， 则 地 上 是 湿 的 ; 

@ 没有 下 十 (否定 前 件 ); 

@ 所 以 ， 地 上 不 湿 ; 

这 显然 也 是 错误 的 ， 因 为 地 上 酒水 时 ， 地 上 也 会 湿 。 

仔细 分 析 P 一 0 的 含义 ， 可知 P 一 0 为 真 时 ， 肯 定 后 件 或 否定 前 件 所 得 到 的 结论 ， 既 可 
能 为 真 ， 也 可 能 为 假 ， 不 能 确定 。 

(5) 假 言 三 段 论 


















































P 一 0 ,0 一 R 一 P 一 R 
即 由 P 一 0，0Q 一 R 为 真 ， 可 推出 PP 一 为 真 。 例 如 : 
“如 果 一 个 人 有 图 书证 ， 则 他 可 以 在 计算 机 书库 借 书 ”, “如 果 一 个 人 可 以 在 计算 机 书库 借 
书 ， 则 他 可 以 借阅 图 书 2 个 月 ”， 则 可 推出 “一 个 人 有 图 书证 ， 则 他 可 以 借阅 图 书 2 个 月 ”。 
(6) 析 取 式 推理 


























= P,PV O00 
即 由 PP 为 假 ， 及 PV0 为 真 ， 可 推出 0 为 真 。 
(7) 二 难 推 理 
PV 0,P—R,0—RSOR 


即 由 PV0Q 为 真 、P 一 RR 为 真 及 0 一 R 为 真 ， 可 推出 R 为 真 。 
(8) 全 称 固化 





(CVYx)P(z) 一 PCy) 

其 中 ，y 为 个 体 域 中 的 任 一 个 体 ， 利 用 此 永 真 更 含 式 可 以 消去 公式 中 的 全 称 量词 。 

(9) 存在 固化 

其 中 ,y 是 个 体 域 中 某 一 个 可 使 P(y) 为 真 的 个 体 。 利 用 此 永 真 蕴 含 式 可 以 消去 公式 中 
的 存在 量词 。 

上 述 等 价 式 和 永 真 蕴含 式 是 进行 演绎 推理 (Deductive Reasoning) 的 重要 依据 ， 又 可 以 
称 为 推理 规则 。 此 外 ， 谓词 逻 辑 中 还 有 一 些 重要 的 推理 规则 : 

(1) PP 规则 在 推理 的 任何 步 又 都 可 以 引入 前 提 。 

(2) 了 规则 在 推理 过 程 中 ， 如 果 前 面 步 又 中 有 一 个 或 多 个 公式 永 真理 含 公 式 S$， 则 可 
将 $ 引入 到 推理 过 程 中 。 
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(3) CP 规则” 如果 能 从 RR 和 前 提 集 合 中 推出 5S 来 ， 则 可 从 前 提 集 合 推出 R 一 5S 来。 其 
中 ,RR 为 任意 引入 的 命题 。 

(4) 反 证 法 PQ， 当 且 仅 当 PA-~ QSF ( 假 )， 即 0 为 P 的 逻辑 结论 ， 当 且 仅 当 
PA-~- 0 是 不 可 满足 的 。 因 此 ， 有 下 述 归结 反 演 定理 . 

0 为 Pl，P,，…，P, 的 逻辑 结论 ， 当 上 且 仅 当 (Pi 人 P, 人 … 信 P,) 人 -0 是 不 可 满足 的 。 

该 定理 是 归结 反 演 的 重要 理论 依据 。 

6. 利用 演绎 推理 解决 问题 

演绎 推理 是 从 全 称 判断 推导 出 单 称 判断 的 过 程 ， 即 由 一 般 性 知识 推出 适合 于 某 一 具体 情 
况 的 结论 ， 是 一 种 从 一 般 到 个 别 的 推理 。 

【 例 2-4】 设 已 知 如 下 事实 : R，S，R->T，SA 人 7T->P，P->0。 求证 : 0 为 真 。 

证 明 : 由 己 规 则 和 假 言 推理 ， 则 尺 ，R 一 7 一 7 

引入 “ 合 取 ” 词 ， 则 S$，7 一 SA7 

由 了 规则 和 假 言 推理 ， 则 SA7T，S$A7 一 P 一 P (推理 过 程 中 引入 SA7) 

由 了 规则 和 假 言 推理 ， 则 忆 ，P 一 0 一 0 (推理 过 程 中 引入 PP) 

0 为 真得 证 。 

【 例 2-5】 设 已 知 如 下 事实 : 几 人 都 要 死 ，Socrates ( 苏 格 拉 底 ) 是 人 。 求 证 : Socrates 
是 要 死 的 。 

证 明 . 定义 谓词 . Man(l x) 表示 “x 是 人 ”，Mortal(x) 表示 “x 是 要 死 的 ”， 则 上 述 知 
识 可 表示 为 : 

QD (Vx)[Man(x)—Mortal(x) |] 

@) Man( Socrates) 

设 7 为 任 一 解释 ， 它 满足 中 和 @。 因 为 对 所 有 xx，7 都 满足 Man(x) 一 Mortal(x)， 则 了 也 
满足 : 






































Man( Socrates ) —*Mortal( Socrates ) 
由 连接 词 化 归 律 ， 即 1 满足 
nm Man( Socrates) V Mortal( Socrates ) 


但 是 由 于 7 满足 Man(l Socrates ) ， 所 以 7 必然 使 ~ Man( Socrates ) 为 假 ， 所 以 了 上 满足 Mortal 
(Socrates) 。 故 Mortal( Socrates) 是 由 和 @) 的 结论 ， 即 Socrates 是 要 死 的 。 

这 就 是 著名 的 Aristotle “三 段 论 ” 

演绎 推理 是 许多 智能 系统 采用 的 推理 方式 ， 成 为 AI 中 一 种 重要 的 推理 方式 ， 其 中 经 常 
用 到 的 形式 就 是 三 段 论 式 ， 它 包括 : 

QD 大 前 提 : 已 知 的 一 般 性 知识 或 假设 ; 

@ 小 前 提 : 关于 所 研究 的 具体 情况 或 个 别 事实 的 判断 ; 

@) 结论 : 由 大 前 提 推 出 的 适合 于 小 前 提 所 示 情 况 的 新 判断 。 

例如 ， 有 如 下 三 个 判断 : 

QD 我 校 计算 机 系 的 学 生 都 要 学 习 人 工 智能 课程 ; 

© Zhang 是 我 校 计算 机 系 的 学 生 ，; 

@ Zhang 要 学 习 人 工 智能 课程 。 
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【 例 2-6】 设 已 知 如 下 事实 : 
Q9 凡是 涉及 中 国文 化 的 讲座 ，Jack 都 感 兴趣 ; 
@《 百 家 讲坛 》 中 的 讲座 都 是 涉及 中 国文 化 的 ; 
(3《 易 经 》 是 《 百 家 讲坛 》 中 的 讲座 ; 
求证 : Jack 对 《 易 经 》 感 兴趣 。 
证 明 : 首先 ， 定义 谓词 如 下 . 
Culture Rostrum(x): x% 是 涉及 中 国文 化 的 讲座 ; 
Ptrested(y，x) : y 对 x 感 兴 
Lecture Room(x): x 是 《 百 家 讲 坛 》 中 的 讲座 ; 
其 次 ， 将 已 知 知识 和 待 求 证 的 问题 用 谓词 公式 表示 出 来 : 
( Vx)[ Culture Rostrum(x) 一 Intrested(Jack,x)] 几 是 涉及 中 国文 化 的 讲座 ，Jack 都 感 
趣 ; 
(Vx)| Lecture Room(x)—Culture Rostrum(x) | 《 百 家 讲 坛 》 中 的 讲座 都 是 涉及 中 国文 
化 的 ; 
Lecture Room( The Book of Changes)《 易 经 》 是 《 百 家 讲 坛 》 中 的 讲座 ; 
Jntrested( Jack，The Book of Changes) Jack 对 《 易 经 》 感 兴趣 。 
推理 过 程 : 
对 于 谓词 公式 ( Vx)[ Culture Rostrum(x) 一 Intrested( Jack,x) ]， 由 全 称 固 化 ， 有 : 
Culture Rostrum(z)—Intrested( Jack ,z) 








米 








同 理 ， 由 全 称 固化 ， 
Lecture Room(y)—Culture Rostrum(y) 
由 尸 规则 及 假 言 推理 得 : 
Lecture Room( The Book of Changes),Lecture Room(y)—Culture Rostrum(y) 
—>Culture Rostrum( The Book of Changes) 
因为 有 一 个 公式 永 真 更 含 Culture Rostrum (The Book of Changes)， 应 用 了 规则 ， 可 以 
再 将 其 引入 推理 过 程 ， 则 由 了 规则 及 假 言 推理 得 : 
Culture Rostrum( The Book of Changes),Culture Rostrum(z)—Intrested( Jack,z) 
—Intrested( Jack, The Book of Changes) 
一 般 来 说 ， 由 已 知事 实 推出 的 结论 可 能 有 多 个 ， 但 只 要 其 中 包含 了 待 证 明 的 结论 ， 问 题 
就 得 到 了 证 明 。 
自然 演绎 推理 的 首要 问题 是 组 合 爆炸 问题 ， 即 随 着 问题 中 知识 的 加 入 ， 推 理 过 程 中 得 到 
的 中 间 结 论 剧烈 增加 ， 以 指数 级 的 方式 增长 ， 这 对 于 一 个 大 的 推理 问题 来 说 十 分 不 利 ， 甚 至 
是 不 可 能 实现 。 组 合 爆炸 问题 也 成 为 20 世纪 60 年 代 AI 面临 的 瓶颈 问题 之 一 。 


























2.4 ”归结 推理 


在 AI 中 ， 几 乎 所 有 的 问题 都 可 以 转化 为 一 个 定理 证 明 问 题 ， 其 实质 是 对 前 提 已 和 结论 
Q@, 证明 P 一 @ 的 永 真性 。 由 “ 永 真 性 ”的 定义 ， 欲 证 明 P 一 0 在 每 个 非 空 个 体 域 上 处 处 永 
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， 要 对 每 个 非 空 个 体 域 上 的 任何 一 个 解释 和 解释 下 的 真 值 情况 做 出 考察 ， 这 一 过 程 是 相当 
se ee 

借助 于 数学 上 “ 反 证 法 ”的 思想 ， 提 出 一 种 基于 逻辑 的 “ 反 证 法 ”。 即 要 证 明 P 一 0 永 
真 ， 只 要 证 明 ” PQ 永 假 。 

由 P=>0S- PVQ, 知 - P=0S-(-PVQ)SPA- QQ， 由“ 永 假 性 ”和 “不 可 满足 
性 ”的 定义 ， 即 要 证 明 PA- 0 的 不 可 满足 性 ( 永 假 性 ) 。 

类 似 这 样 ， 从 PAn 0O 使 用 推理 规则 找 出 矛盾 ， 从 而 证 明 P 一 Q@ 是 定理 的 方法 ， 
称 为 “归结 ( Resolution) 演绎 推理 ”。 归 结 是 PROLOG (逻辑 设计 语言 ，Programming in 
Logic ) J 理 规 则 。 

关于 谓词 公式 的 不 可 满足 性 证 明 ， 海 伯 伦 (Herbrand) 和 和 鲁 宾 逊 ( Robinson) 先后 做 出 
人 


2.4.1 子 句 集 及 其 简化 





























1. 子 句 与 子 句 集 
一 般 地 ， 归 结 推 理 所 应 用 的 对 象 是 命题 或 谓词 公式 的 一 种 特殊 形式 ， 称 为 “ 子 句 ” 
(Clause ) 。 


单个 谓词 公式 称 为 原子 (atom) 谓词 公式 ,如 P(x)、-- P(x) 等 。 

在 谓词 逻辑 中 ， 将 原子 谓词 公式 及 其 否定 形式 统称 为 “文字 ”(literal) 。P(x) 为 正文 
字 ,，- P(x) 为 负 文 字 ，P(x) 与 ~ P(x) 为 互补 文字 。 

任何 文字 的 析 取 式 称 为 “ 子 句 ”。 如 P(x)VQ(x)V- R(x)。 

包含 任何 文字 的 子 句 称 为 “空子 句 ”" 。 因 为 其 不 包含 文字 ， 不 能 被 任何 解释 满足 ， 所 


























以 是 “ 永 假 ” 的 ， 是 “不 可 满足 ”的 。 空 子 名 记 为 “ 口 ”或 “NIL”。 
由 子 句 或 空子 句 所 构成 的 集合 称 为 “ 子 句 集 ”(5)。 
2. 范式 
在 谓词 演算 中 ， 一般 地 ， 有 两 种 范式 ,一 种 叫 “ 前 束 型 范式 ”， 一 种 叫 Skolem 范式 。 


(1) 前 束 型 范式 ”对 于 一 个 谓词 公式 ， 和 存在 量词 ) 均 非 
否定 地 出 现在 公式 的 最 前 面 ， 旦 它 的 辖 域 一 直 延 伸 到 公式 之 未 ， 同 时 公式 中 不 出 现 蕴含 连接 
词 “ 一 ”和 等 价 连接 词 “<”， 这 种 形式 的 公式 称 为 前 束 型 范式 。 例 如 : 

ee Q(y,x) VF(Y,z)] 








即 是 一 个 前 束 型 范 

前 束 型 范 了 工人 Y 式 的 最 前 面 ， 称 为 公式 的 “ 首 标 ”， 而 公 
式 的 其 余部 分 实际 上 是 一 个 谓词 演算 公式 。 该 形式 的 缺点 在 于 首 标 杂 乱 无 章 ， 全 称 量 词 和 存 
在 量词 的 排列 没有 一 定 的 规则 。 

(2) Skolem 范式 L.Skolem (斯 格林 ) 对 上 述 前 束 型 范式 进行 了 改进 ， 使 其 首 标 中 不 
出 现存 在 量词 ( 了 ) ， 从 前 束 型 范式 中 消去 全 部 存在 量词 得 到 的 公式 称 为 “Skolem 范式 ”， 
或 称 为 “Skolem 标准 型 ”。 

这 种 变换 存在 两 种 情况 : 

1) 当 存 在 量词 不 出 现在 全 称 量词 的 辖 域内 时 ， a 
只 需 用 一 个 新 的 个 体 常 量 代替 受 该 存在 量词 约束 的 变 元 ， 即 可 消去 存在 量词 。 这 是 因为 ， 
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谓词 公式 真 值 为 了 ， 总 能 找到 一 个 个 体 常量 ， 替 换 后 使 公式 的 真 值 为 7。 注意 : 新 替换 的 个 
体 常量 一 定 是 原 谓词 公式 中 没有 出 现 过 的 量 。 即 : 
( 习 x)(Vy) [P(x)VQ(Y) 1] 替换 为 (Vy)[P(t) V Q(t,y)] 

2) 当 存 在 量词 出 现在 全 称 量词 的 辖 域内 时 ， 如 谓词 公式 (Vx)( 3y)[P(x)V Q(x,y)]， 
此 时 ， 对 于 每 一 个 x， 都 存在 一 个 y 与 之 对 应 ，y 的 取 值 依赖 于 x， 记 为 AFx) ， 称 为 Skolem 
函数 ， 用 Skolem 函数 代替 每 一 个 存在 量词 量化 的 过 程 ， 称 为 “Skolem 标准 化 ”， 则 有 

(Vx) ( 337) [P(x) V Q(x,y) ] 兰 换 为 (Vw) [P(x) V Q(x,f(x))] 
注意 : 不 同 变 元 对 应 的 Skolem 函数 的 函数 符号 要 有 所 不 同 。 如 谓词 公式 : 
(Vi)( 37y)( 32) [P(x) V OG,y) VF(y,2)] 

引入 Skolem 函数 A (x) 、g (x) ,分别 蔡 换 y 和 z， 则 有 

CYx) (37)(3z)[P(x)V Q(x,y) VF(y,z)] 替 换 为 (Vx) [P(x) V Q(x,f(x)) VF 
(x) ,g(x) ) ]， 得 到 Skolem 范式 。 

更 为 一 般 的 形式 : 当 存 在 量词 位 于 多 个 全 称 量词 的 辖 域内 时 ， 如 谓词 公式 : 

(Vx) CVas) (Vax,)( dy) [LPOx eVOC ,Xs ,X,Y) ] 
此 时 ， 需 要 用 Skolem 函数 f(xi，x,，…，%，) 蔡 换 受 该 存在 量词 约束 的 变 元 ， 消 去 存 
在 量词 ， 即 
(Vx) CVxa) eC Vxa) LP xy, Xa ,KX,) V OC ,Kas ,Nf (Xs Xa, ,Xi, ) ) | 
Skolem 范式 的 一 般 形式 表示 为 : 
(Vix) Vax) Vx) M(x ,Na an) 

其 中 ，M(xi ，x,，…，%) 是 一 个 合 取 范式 ， 称 为 Skolem 范式 的 母 式 。 

3. 子 句 集 的 简化 

在 谓词 逻辑 中 ， 任 何 一 个 谓词 公式 都 可 以 通过 应 用 等 价 关 系 或 推理 规则 化 为 相应 的 子 句 
集 ， 从 而 能 够 比较 容易 地 判定 谓词 公式 的 不 可 满足 性 。 

下 面 结合 具体 实例 ， 说 明 将 谓词 公式 化 为 子 句 集 的 一 般 步 又。 

【 例 2-7】 将 谓词 公式 (Vx)((CV7) Pry) 一 (Vy)(0(x,y) 一 F(x,y))) 化 为 子 
句 集 。 

(1) 消去 谓词 公式 中 的 连接 词 符 号 “一 ”和 “>” 

利用 谓词 公式 的 等 价 关 系 

连接 词 化 归 律 P-Oen PVO 

Poe>Oe(PAO)V(nPAn 0) 











上 式 等 价 变换 为 

(Vx) (Tm (CVIPOX,Y) Vo (VY) (CT Q(x,y) VF(x,Y))) 
(2) 把 否定 符号 移 到 紧 靠 谓词 的 位 置 上 ,减少 否定 符号 的 辖 域 
利用 谓词 公式 的 等 价 关系 


双重 否定 律 -7 - PoP 

德 . 摩根 定律 -7 (PVO)S-J- PA-0 
-7 (PAQ)S-J- PV- 0 

量词 转化 律 -7 (dx)PoO( Vx)(- P) 


-7 (Vx)PoO( jx)(- PP) 


A 
SS 
A 
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上 式 等 价 变换 为 
(VYx)((3y7)n Px,y)V (IYy) (Q(x,y) AnFGx,y))) 
(3) 变量 标准 化 ” 即 重新 命名 变 元 ， 使 每 个 量词 采用 不 同 的 变 元 ， 使 得 不 同 量词 的 约 
束 变 元 有 不 同 的 名 字 。 则 上 式 等 价 变换 为 
(Vx)((3y)- Px,y)V( jz) (Q(x,z) Am F(x,z))) 
(4) 消去 存在 量词 ”利用 上 述 化 为 “Skolem 范式 ”的 方法 ， 对 于 此 例 ， 由 于 ( 3y) 
和 (3z) 都 位 于 全 称 量词 ( Vx) 的 辖 域内 ， 要 用 Skolem 函数 替换 受 该 存在 量词 约束 的 变 
元 ， 设 蔡 换 函数 分 别 为 Ax) 和 g(x)， 则 上 式 等 价 变 换 为 
(Vx)(= P(x,f(x))V (QO(x,g(x)) Mm F(x,g(%)))) 
(5) 化 为 前 束 型 范式 ” 即 所 有 全 称 量词 均 非 否定 地 出 现在 公式 的 最 前 面 ， 且 它 的 辖 域 
一 直 延 伸 到 公式 之 末 ， 对 于 此 例 ， 因 为 只 有 一 个 全 称 量词 ， 并 且 已 经 位 于 公式 的 最 前 面 ， 这 
一 步 不 需要 做 任何 工作 。 
(6) 化 为 Skolem 范式 即 化 为 标准 形式 : 
(Vx Vax) :ee( Vx,) M(x ,X,Y, ) 
母 式 人 (x1，x2，…，%,) 为 一 个 合 取 范式 。 
利用 谓词 公式 的 等 价 关 系 
分 配 律 PV(QOAR)S(PVO)A(PVR) 
PA(OVR)IOG(PAO)V (PAR) 











则 上 式 等 价 变换 为 
(Ya)(CCn P(xsf(x)) V OCse(x))) A P(xz))VnFOce(z)))) 

到 此 ， 实 际 上 是 将 谓词 公式 化 为 Skolem 范式 的 一 般 步骤 。 但 对 于 化 为 子 句 集 ， 还 要 有 
以 下 操作 ; 

(7) 略 去 全 称 量词 ”由 于 公式 中 所 有 变量 都 是 全 称 量词 量化 的 变量 ， 因 此 ， 可 以 省 略 
全 称 量词 ， 母 式 中 的 变量 仍然 认为 是 全 称 量词 量化 的 变量 。 则 有 

CPVCD)VOGECDD))ACn Pf)) Vo Pre(®))) 
(8) 消去 合 取 词 ， 把 母 式 用 子 句 集 表 示 ， 即 用 逗号 “,” 代 替 合 取 符号 “人 A，” 
有 








(= Ps))VOGse(nD)) ,= P(x f(x)) Va P(x,g(x))| 

(9) 子 句 变量 标准 化 ”即使 得 每 个 子 句 中 的 变量 符号 不 同 

芽 助 谓词 公式 的 性 质 

(Ve) [P(x) AQ(x) JS( Vx) P(x) A( VY)Q()) 
因此 有 
(= P(xsf(x)) VOGxs8(x)) ,= POYAY)) Va Fy,g(y))| 

到 此 ， 得 到 子 句 集 $。 由 于 子 句 集中 的 每 一 个 子 句 都 是 一 些 文字 的 析 取 ， 处 理 起 来 比较 
方便 ， 较 容易 地 证 明 谓 词 公式 的 不 可 满足 性 问题 。 

4. 不 可 满足 意义 上 的 一 致 性 

设 有 谓词 公式 C， 其 对 应 的 子 句 集 为 $S， 则 C 是 不 可 满足 的 充 要 条 件 是 ; $ 是 不 可 满足 
的 。 这 里 要 注意 ， 谓 词 公式 6 与 其 子 句 集 为 $ 并 不 等 值 ( 真 值 同 为 了 或 瓦 ， 但 两 者 在 不 满 
足 性 上 是 一 致 的 。 
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【 例 2-8】 设 有 一 个 谓词 公式 C=( 3x)(- P(x)), 设 6 的 个 体 域 为 D=|1，2|， 则 G= 
(dx)(- P(x))=- P(1)V- P(2) 

设 有 一 解释 16: P(1)=7，P(2)=， 则 在 此 解释 下 ,Gl|1c=- P(1)V- 0(1)=7 

而 CG 的 Skolem 范式 表示 为 -2 P(x)， 而 x 是 个 体 域 上 的 某 个 值 ， 若 取 x = 1， 此 时 ， 
nm”P(1)= 下 ， 则 公式 G 与 其 Skolem 范式 并 不 等 值 ， 即 公式 G 与 其 子 句 集 S= 1 P(x)| 并 不 
等 值 。 


2.4.2 海 伯 伦 定 理 


由 上 述 分 析 ， 一 个 谓词 公式 G 与 其 对 应 的 子 句 集 $ 在 不 可 满足 意义 上 具有 一 致 性 ， 从 
而 将 G 的 不 可 满足 性 分 析 转 化 为 对 其 子 句 集 5 的 不 可 满足 性 判断 。 相 应 地 ， 判 定子 句 集 的 
不 可 满足 性 ， 就 需要 对 集合 中 的 子 句 逐 一 进行 判定 ， 而 为 了 判定 某 个 子 句 的 不 可 满足 性 ， 就 
需 证 明 该 子 句 对 非 空 个 体 域 上 的 任何 一 个 解释 都 是 不 可 满足 的 ， 由 于 个 体 域 p 的 任意 性 和 
解释 个 数 的 无 限 性 ， 这 是 一 件 非常 困难 的 工作 。 

能 否 针对 一 个 具体 的 谓词 公式 ， 找 到 一 个 比较 简单 的 特殊 域 ， 只 要 使 该 谓词 公式 在 该 特 
殊 域 上 是 不 可 满足 的 ， 就 能 保证 其 在 任 一 域 上 也 是 不 可 满足 的 呢 ? 海 伯 伦 (Herbrand) 就 构 
造 了 这 样 一 个 特殊 的 域 ， 称 为 Herbrand 域 (或 五 域 )， 并 证 明 只 要 对 子 句 在 五 域 上 的 一 切 解 
释 进行 判定 ， 就 可 以 获得 原 谓词 公式 的 不 可 满足 性 ， 从 而 使 问题 得 到 简化 。 

1. 吕 域 

设 谓词 公式 G 的 子 句 集 为 S$， 则 按 下 述 方法 构造 的 个 体 变 元 域 H, 称 为 公式 G 或 子 句 集 
S 的 Herbrand 域 ， 简 称 玖 域 。 

(1) 令 古 是 $ 中 所 出 现 的 常量 的 集合 。 若 $ 中 没有 常量 出 现 ， 则 任 取 一 个 常量 aeD 
(D 为 谓词 公式 G 的 个 体 域 )， 规 定 H= 14al。 

(2) 2 

HH; =HiU145 中 所 有 的 形 如 fw ,…,t,) 中 的 元 素 | (i=0,1,2,…,n) 

其 中 , f(t，…, 二) 是 G 中 出 现 的 任 一 函数 符号 ， 而 t1 ，…， 4 是 有 1, 中 的 元 素 。 

下 面 给 出 求 豆 域 的 例子 ， 以 说 明 万 域 的 构造 方法 。 

【 例 2-9】 求 子 句 集 S=1n P(z)VO(z) ,TCRK7)) 的 五 域 。 

这 个 例子 中 ，$ 中 没有 出 现 个 体 常量 ， 则 应 任 取 一 个 常量 a 作为 个 体 常量 ， 出 现 一 个 函 
数 A(y) ， 则 根据 五 域 的 定义 ， 有 

Ho= 1al 
Hi=|a,f(a)| 


H,=|a,fla) ,f(fla))| 














Hs, = {a,fla) ff (a)) ,fff a))) ,~ 
【 例 2-10】 求 子 句 集 S=|P(x) ,0O(7)Vn R(z)| 的 五 域 。 
这 个 例子 中 ，5S 中 既 没 有 出 现 个 体 常 量 ， 也 没有 出 现 函 数 ， 则 应 任 取 一 个 常量 a 作为 个 
体 常量 ， 
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Ho= | ol 
Hi=H, UP=H 
H,=H' 


H, =|al 
【 例 2-11】 求 子 句 集 5=|a,5,P(f(x)),Q(y)V-R(g(y))| 的 五 域 。 
这 个 例子 中 ,5 中 有 两 个 个 体 常 量 a 和 6， 两 个 函数 f(x) 、g(y)， 根据 瑟 域 的 定义 ， 有 
Ho=|a,b|! 
Hi=|a,b,fla) ,f(b) ,g(a),e(b)| 
Hy=|a,b fla) ,f(b),e(a),g(b) ,ff Ca)) FAL)) ,fg(a)),fls(b)),s(f(a)), 
g(f(5)) ,gs(g(a)) ,g(a(b))| 


H, =Ho UH UH 

2. 原子 集 

除了 引入 五 域 , 还 要 讨论 瑟 域 上 子 句 集 5 的 真 值 ， 为 此 ， 引 入 原子 集 的 概念 。 

定义 下 列 集合 为 子 句 集 $ 的 原子 集 : 

A= | 所 有 形 如 P(4i ,ts,… ,i, ) 的 元 素 | 

其 中 ，P( ,ty，…,t,) 是 出 现在 5 中 的 任 一 谓词 符号 ， 而 三 ,已 ，…, 才 则 是 $ 的 万 
域 上 的 任意 元 素 。 

【 例 2-12】 求 子 句 集 S=1P(o) ,oOCx)VR(CsCx))} 的 原子 集 。 

应 先 求 取 其 五 域 ， 由 五 域 的 定义 : 

H=|a,g(a),g(g(a)),.…| 
由 于 在 子 句 集中 ， 出 现 了 P、Q 和 RR 三 个 谓词 ， 所 以 5 的 原子 集 为 : 
A=|P(a),Q(a),R(a) ,P(g(a)),0(g(a)),R(g(a)),P(lg(g(a))),0(g(g(a))), 
R(g(g(a))),…| 

由 于 $ 中 的 谓词 个 数 是 有 限 的 ， 而 五 域 是 可 数 的 无 穷 集合 ， 所 以 原子 集 4 也 是 可 数 集 。 
这 一 点 很 重要 ， 为 后 面 的 证 明 提 供 了 有 利 的 帮助 。 

再 给 出 下 列 一 组 定义 : 

将 没有 变 元 出 现 的 原子 、 文 字 、 子 句 和 子 句 集 分 别称 为 “ 基 原 子 ”“ 基 文字 ”“ 基 子 
名 ”和 “ 基 子 句 集 ”。 如 果子 句 C 中 的 所 有 变 元 符号 均 用 五 域 中 的 元 素 替 换 ， 所 得 到 的 基 子 
句 称 为 C 的 一 个 “ 基 例 ”。 例 如 : 

子 句 集 S=|P(a),- Q(x) VR(g(x))| 
由 五 域 的 定义 ， 得 到 





H=|a,g(a),g(g(a)),.…| 
对 于 子 句 P(a) ， 因 为 其 已 经 不 含有 变 元 ， 故 为 一 个 基 子 句 ， 并 且 ae 有 ， 所 以 其 也 是 一 
个 基 例 。 
对 于 子 句 - Q(x) VR(g(x))， 先 任 取 一 个 常量 be D 且 bg， 将 b 替换 变 元 x， 得 到 
-Ql(5)V R(g (5b)),， 然 后， 以 五 域 中 的 茶 个 元 素 ， 如 g(a) 替换 所 有 变 元 5»， 得 到 
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-0(g(a))VR(g(g(a)))， 就 称 为 子 句 - 0(x) VR(g(x)) 的 一 个 基 例 。 
3. 5 在 作 域 上 的 解释 
给 出 以 下 定理 : 设 了 是 子 句 集 $ 在 个 体 域 D 上 的 一 个 解释 ， 则 总 存在 对 应 于 7 的 五 域 的 
解释 7 ， 使 得 若 S|,=7T， 就 必 有 S|; =7。 这 里 ， 设 子 句 集 的 原子 集 为 4， 则 对 4 中 各 元 素 真 
值 (7 或 f) 指派 都 是 5 的 一 个 五 解释 。 
【 例 2-13】 已 知 一 个 子 句 集 5= |P(a),- Q(x)VR(g(x))| 
由 五 域 的 定义 ,得 到 
H=|a,g(a),g(g(a)),…| 
S 的 原子 集 为 : 
4=1P(a),OCc) ,Ra),P(eCa)),OCCa)) ,RSsCa)) ,PsCs(Ca))) ,OCSC8Ca) ) )， 
R(g(g(a))),.…| 
则 下 列 每 一 个 解释 都 是 子 句 集 $ 的 一 个 互 解释 : 
f={P(a),Q(a),R(a),P(lg(a)),0(g(a)),R(g(a)),P(lg(g(a))),0(g( g(a))), 
R(g(g(a))),.…| 
B=|P(a),- O(a),R(a),- Plg(a)),0(g(a)),R(e(a)),- Plg(g(a))), 
Q(g(g(a))),R(g(g(a))),.…| 











因为 原子 集 4 也 是 可 数 集 ， 所 以 $ 的 五 解释 也 是 可 数 的 。 
引入 一 个 例子 ， 以 说 明 如 何 应 用 个 体 域 D 上 的 一 个 解释 1， 来 构造 其 对 应 万 域 上 的 一 个 解 
释 。 设 子 句 集 5=|- P(x)V Q(x) ,R(g(y) )}， 其 对 应 的 谓词 公式 的 个 体 域 为 D=|1,2|。 
由 五 域 和 原子 集 的 定义 ， 得 到 
H=|a,g(a),g(g(a)),…| 
A=|P(a),Q(a),R(a) ,Plg(a)),0(g(a)),R(g(a)),.…| 
由 D=|11, 2}, 设 1 是 D 上 的 一 个 解释 ， 做 如 下 设 定 : 
g(1) g(2) P(1) P(2) 0Q(1) 0Q(2) R(1) R(2) 
2 2 F 7T 7T F T T 
将 上 述 各 值 代入 , 便 有 S|,=7， 即 已 经 找到 D 上 的 一 个 解释 1， 使 得 S|1,=7。 下 面 ， 我 
们 试图 构造 其 对 应 万 域 上 的 一 个 解释 1， 使 得 S|) =7。 
有 H=|a,g(a),g(g(a)),…|， 这 里 , 有 中 的 常量 为 a， 其 并 未 在 D 中 设 定 给 定 值 ， 所 
以 ， 可 以 设 定 为 a=1 或 a=2。 假设 此 处 令 a=1,， 结合 1 中 的 取 值 ， 则 
g(a) 8(1)—=2 
g(g8(a)) 8(2)—2 
g(g(g8(a))) m8(2)—2 











再 确定 原子 集 4 中 的 取 值 ， 即 
P(o) 一 P(1) 一 FF 
Ooa) 一 OU1) 一 了 
R(a)—R(1)—7T 
Plg(a)) P(g(1))—P(2)—7 
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Ql(g(a) 0(8(1)) O02) OF 
R(g(a) >Re(1)) ER2) ET 


于 是 , 便 构造 D 上 的 解释 了 相对 应 的 五 域 上 的 一 个 解释 了 
T=|- Pl(a),Q(a),R(a),P(lg(a)),- OQ(g(a)),R(g(a)) ,| 
同 理 ， 若 取 a=2， 结合 1 中 的 取 值 ， 则 
g(a) 8(2)—2 
g(g8(a)) 8(2)—2 
g(g(g8(a))) 28(2)—2 








再 确定 原子 集 4 中 的 取 值 ， 即 
P(a) 一 P(2) 一 了 

Q(a) 0(2) oF 
R(a) 2 R(2)—7 

Plg(a)) P(g(2)) =P(2) oT 
Ql(g(a)) 0(8(2)) 0(2) oF 
R(g(a) >R(g(2)) OR(2) 一 了 了 


于 是 , 便 构造 D 上 的 解释 了 相对 应 的 五 域 上 的 一 个 解释 了 : 
T=|P(a),- Q(a),R(a),P(lg(a)),- OQ(g(a)),R(g(a)) ,| 

说 明 : 只 要 存在 子 句 集 $ 在 个 体 域 D 上 的 一 个 解释 I， 则 总 存在 对 应 于 7 的 五 域 的 解释 
了 ， 使 得 若 S |,=7T7， 就 必 有 S|,'=7。 

根据 上 述 讨 论 ， 有 以 下 定理 : 

【定理 2-1】 子 句 集 $ 不 可 满足 的 充 要 条 件 是 : S 对 五 域 上 的 一 切 解 释 都 为 假 。 

证 明 : 

充分 性 : 如 子 句 集 $ 在 个 体 域 D 上 具有 不 满足 性 ， 则 必然 在 五 域 上 具有 不 满足 性 ， 从 
而 对 五 域 上 的 一 切 解 释 都 为 假 (根据 不 满足 性 的 定义 )。 

必要 性 : 如 5 在 五 域 的 一 切 解释 都 为 假 ， 则 必然 会 使 其 在 D 上 的 一 切 解 释 都 为 假 。 否 
则 ， 如 存在 D 上 一 个 解释 使 S 为 真 (S|; =7)， 那 么 ,根据 上 述 定理 ， 必 存在 $ 在 万 域 
上 的 一 个 解释 及 ,使 得 $1),=7T， 这 与 已 知 (5 在 矿 域 的 一 切 解释 都 为 假 ) 矛盾 ， 故 必要 性 
得 证 。 

证 毕 。 

4. Herbrand 定理 

【定理 2-2】 子 句 集 $ 不 可 满足 的 充 要 条 件 是 : 存在 一 个 有 限 的 不 可 满足 的 基 例 集 5'。 

证 明 : 

充分 性 : 设 子 句 集 $ 有 一 个 不 可 满足 的 基 例 集 $'， 因 为 它 是 不 可 满足 的 ， 所 以 一 定 存 
在 一 个 解释 二， 使 得 $ 为 假 (5S'|,=F)。 根 据 五 域 上 的 解释 与 D 上 的 解释 的 对 应 关系 ， 可 
知 在 九 上 一 定 存在 一 个 解释 7， 使 $ 不 可 满足 (S|1,=F)。 根 据 不 可 满足 性 的 定义 ， 可 知 子 
句 集 $ 是 不 可 满足 的 。 
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必要 性 : 设 子 句 集 $ 不 可 满足 ， 由 子 句 集 $ 不 可 满足 的 充 要 条 件 是 : S 对 万 域 上 的 一 切 
解释 都 为 假 ， 知 5 对 五 域 上 的 一 切 解释 都 为 假 。 那 么 ,就 至 少 存在 一 个 5 中 的 某 子 句 C; 的 
基 例 C! 为 假 ， 因 而 5 的 基 例 集 $' 是 不 可 满足 的 。 并 且 ， 由 于 $ 中 的 子 句 是 有 限 的 ， 则 5 的 
不 可 满足 的 基 例 数 也 是 有 限 的 。 

证 毕 。 

诚然 ，Herbrand 定理 只 是 在 理论 上 给 出 证 明子 句 集 不 可 满足 性 的 可 行 性 和 方法 ， 利 用 计 
算 机 实现 定理 自动 证 明 问 题 仍 比 较 困 难 ， 直 到 1965 年 ，Robinson 提出 了 归结 原理 ， 才 真正 
使 机 器 定理 证 明 变 为 现实 ， 以 下 探讨 Robinson 归结 原理 。 


2. 4. 3 ”Robinson 归结 原理 


Robinson 归结 原理 又 称 为 “消解 原理 ”， 是 Robinson 提出 的 一 种 通过 证 明子 句 集 不 可 满 
足 性 ， 从 而 实现 定理 证 明 的 一 种 理论 和 方法 ， 成 为 机 器 定理 证 明 的 基础 。 

前 面 已 经 谈 到 ， 对 于 一 个 子 句 集 来 说 ， 因 为 子 句 之 间 是 一 种 合 取 关系 ， 只 要 一 个 子 句 是 
不 可 满足 的 ， 则 子 句 集 就 是 不 可 满足 的 。 由 于 空子 句 是 不 可 满足 的 ， 那 么 ， 若 有 一 个 包含 空 
子 句 的 子 句 集 ， 则 称 这 个 子 句 集 是 不 可 满足 的 。Robinson 归结 原理 正 是 基于 这 一 思想 而 提出 
的 。 即 : 检查 子 句 集 $ 中 是 否 有 空子 句 ， 若 有 ， 表 明 该 子 句 集 $ 是 不 可 满足 的 ; 若 没 有 ， 就 
在 子 句 间 选 择 合适 的 子 句 进行 归结 ， 一 旦 通过 归结 得 到 空子 句 ， 就 表明 该 子 句 集 5 是 不 可 满 
足 的 。 

下 面 ， 针 对 命题 逻辑 和 谓词 逻辑 ， 分 别 给 出 归结 的 定义 。 

1. 命题 逻辑 中 的 归结 原理 

(1) 归结 与 归结 式 

定义 : 设 C, 与 C, 是 某 子 句 集 中 的 任意 两 个 子 句 ， 如 果 C 中 的 文字 万 与 C, 中 的 文字 
万 互补 ， 那 么 从 C， 和 CC, 中 分 别 消去 Ll 和 克 ， 并 将 两 个 子 句 中 余下 的 部 分 析 取 ， 构 成 一 个 
新 的 子 句 ， 这 一 过 程 称 为 “归结 ”; 所 得 到 的 子 句 Cj, 称 为 C， 和 C, 的 归结 式 〈Resolvent ) ， 
称 Cl 和 CC, 为 C1; 的 亲本 子 句 。 

举例 对 上 述 定义 进行 解释 。 

【 例 2-14】 设 两 个 子 句 Cl=PVCIY、C,=~ PV Cs;, 求 两 子 句 的 归结 式 C1,。 

由 于 P 与 -~ P 是 互补 文字 ,消去 后 ， 得 到 

C2=CIVCS 

则 Gj, 就 是 C, 和 C, 两 个 子 句 的 归结 式 ， 这 一 消去 互补 子 句 的 过 程 即 为 归结 。 可 以 用 归 
结 树 (语义 树 ，Semantic Tree) 给 出 其 直观 表示 ， 如 图 2-1 所 示 : 

又 如 , 设 Ci,=PVO，C, =- 0OVR，C; = PP， 对 其 进行 归结 时 ， 可 首先 对 C; 和 C, 归 
结 ， 得 到 



































CD=PVR 
然后 将 Cj 和 C3 进行 归结 ， 得 到 
C123 = 及 
这 一 归结 过 程 如 图 2-2 所 示 : 
当然 ， 如 果 首先 对 Cl 和 C 进行 归结 ， 再 将 归结 式 与 C 归结 ， 会 得 到 相同 的 结果 。 
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图 2-1 归结 过 程 树 形 表示 图 2-2 ”归结 过 程 树 形 表示 


【定理 2-3】 归结 式 Cl, 是 其 亲本 子 句 C, 和 C, 的 逻辑 结论 。 
证 明 : 设 Cl=LVC’, C;=~-LVC;， 则 
G2=0 VC 
由 连接 词 化 归 律 CV LE- CI 一 六 
-LVC SL C0) 
则 CAC =(n CioL) A (LO0;) 
根据 假 言 三 段 论 ， 得 到 





(7 CIPL) A(LOC)S7 CioO0; 
再 次 根据 连接 词 化 归 律 
-CIC OCIV C=C1 
所 以 , C1 和 AC, 寺 C1 
即 如 果 Cl 和 C, 为 真 ， 则 C1, 为 真 ， 归 结 式 Cj, 是 其 亲本 子 句 C 和 C, 的 巡 辑 结论 。 
这 是 归结 原理 中 的 一 个 很 重要 定理 ， 由 它 可 以 得 出 两 个 重要 的 推论 : 
【推论 2-1】 设 Ci 与 C, 是 子 句 集 $ 中 的 两 个 子 句 ，Cis 是 Cl 和 C， 的 归结 式 ， 帮 用 Ci 
代替 C; 和 C, 后 得 到 新 子 句 集 S1 ， 则 由 Si 的 不 可 满足 性 可 推出 $ 的 不 可 满足 性 ， 即 
Si 的 不 可 满足 性 ==5 的 不 可 满足 性 
【推论 2-2】 设 Ci 与 Cs 是 子 句 集 $ 中 的 两 个 子 句 ，C1s 是 C 和 C, 的 归结 式 ， 若 将 Ci 
加 入 到 原子 句 集中 ， 得 到 新 的 子 句 集 $ ， 则 5 与 $, 在 不 可 满足 的 意义 上 是 等 价 的 ， 即 
S, 的 不 可 满足 性 会 S 的 不 可 满足 性 
这 两 个 推论 表明 : 若 要 证 明子 句 集 S 的 不 可 满足 性 ， 只 要 对 其 中 可 进行 归结 的 子 句 进行 
归结 ， 并 将 归结 式 加 入 $ 中 ,或 者 将 归结 式 蔡 换 它 的 亲本 子 句 ， 然 后 对 新 的 子 句 集 (5 或 
S,) 证 明 不 可 满足 性 就 可 以 了 。 因 为 空子 句 是 不 可 满足 的 ， 因 此 若 经 过 归结 ， 最 终 获 得 空 
子 句 ， 就 可 以 得 到 原子 句 集 是 不 可 满足 的 。 这 就 是 应 用 归结 原理 证 明子 句 集 不 可 满足 性 的 
思想 。 
(2) 归结 推理 过 程 ”在 命题 逻辑 中 ， 应 用 归结 进行 推理 的 过 程 如 下 : 
Q 对 原子 句 集 $ 中 可 归结 的 子 句 进行 归结 ; 
@) 将 归结 得 到 的 归结 式 加 入 到 $ 中 ， 得 到 新 的 子 句 集 5'; 
@) 检查 新 的 子 句 集 $' 是否 有 空子 句 ， 如 有 ， 则 停止 推理 ; 否则 ， 转 步 又 @@; 
@ 置 $: =$'， 转 步骤 四 。 
引入 下 例 ， 以 说 明 命 题 逻 辑 的 归结 推理 过 程 。 
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【 例 2-15】 证 明子 句 集 S=1PV- 0,，0, -P| 是 不 可 满足 的 。 

证 明 : 按照 上 述 归 结 推理 的 过 程 ， 则 

OPVvVn-O 





由 P 中 和 外 进行 归结 。 

NIL ”名和 进行 归结 。 

由 于 $ 中 出 现 了 空子 名 NIL， 从 而 证 明了 5S 的 不 可 满足 性 。 

(3) 归结 原理 的 完备 性 ”在 命题 逻辑 中 ， 对 不 可 满足 的 子 句 集 $S， 归 结 原理 是 完备 的 。 
即 大 子 句 集 $ 不 可 满足 ， 则 必然 存在 一 个 从 $ 到 空子 句 集 的 归结 演绎 ; 若 存在 一 个 从 $ 到 空 
子 句 集 的 归结 演绎 ， 则 $ 一 定 是 不 可 满足 的 。 但 是 ， 对 于 那些 可 满足 的 子 句 集 $， 使 用 归结 
原理 则 得 不 到 任何 结果 。 

2. 一 阶 谓词 逻辑 中 的 归结 原理 

在 一 阶 谓 词 逻 辑 中 ， 由 于 子 句 中 含有 变 元 ， 所 以 不 能 像 命题 逻辑 那样 可 直接 消去 互补 文 
字 进 行 子 句 归结 ， 而 是 先 使 用 置换 与 合 一 的 思想 ， 对 子 句 中 的 某 些 变 元 进行 合 一 置换 ， 对 置 
换 后 的 新 子 句 再 次 使 用 归结 原理 。 

(1) 先 给 出 置换 与 合 一 的 理论 

1) 置换 的 概念 。 置 换 是 形 如 1 ，t/x2，…，t/x,| 的 一 个 有 限 集 。 其 中 ，>; 是 
变量 , i; 是 不 同 于 x; 的 项 ， 可 以 是 常量、 变量 或 者 函数 ，54x; 表示 用 i 代 换 公式 中 的 x;， 
wiF%(i#)), i, 关 1，2，…，ma 

如 有 限 集 Ea/x,f(5)/y,w/z| 是 一 个 置换 ， 而 有 限 集 1g(y)/x,f(x)/y| 不 是 一 个 置 
换 ， 因 为 这 个 fx)/y 代 换 导致 g (f(x))/x， 这 不 符合 置换 的 定义 。 而 有 限 集 {g(a)/x， 
所 zx) 上 是 一 个 置换 ， 其 中 , x 用 g(a) 代 换 ,y 用 f(g(a)) 代 换 。 

不 含 任何 元 素 的 置换 称 为 空置 换 ， 表 示 为 e。 

置换 可 以 作用 于 谓词 公式 上 ， 也 可 以 作用 于 某 一 项 上 。 若 令 置换 0= | /x ,ty/x，…， 
i,/x,| ，P 为 一 个 谓词 公式 ， 那 么 9 作用 于 P， 就 是 将 P 中 出 现 的 变量 x, 以 i 代入 (i=1， 
2，…, nn) ， 结 果 以 Pb 表示 ， 称 之 为 P 的 一 个 特例 (instance)。 如 : 

0=|a/x,f(b)/y,t/z|, P=F(x, y, z)， 则 

PO=F(a,f(b),t) 

当 9 作用 于 某 一 项 w 时 ， 就 是 将 该 项 中 出 现 的 变量 x; 以 i 代入 (i=1，2,…, n)， 结 
果 以 u9 表示 ， 如 

0=|a/x,f(b)/y,t/z|, u=e(x, z)， 则 

u0=g(a,t) 








一 般 地 ， 置 换 并 不 是 唯一 的 。 

2) 置换 乘法 。 置 换 乘 法 的 作用 是 将 两 个 置换 合成 为 一 个 置换 。 以 具体 实例 说 明 置 换 乘 
法 的 实现 。 

设 有 两 个 置换 9= | ,PN ,tAxX;| ;和 =|s1Ay1 52/Y2，… ,5S/Ym| ， 则 二 者 的 乘积 》 
一 个 新 的 置换 ， 表 示 为 0. 入， 将 其 作用 于 谓词 公式 G6， 相当 于 先 9 后 入 对 G 的 作用 ， 定 
义 为 : 


(35) 
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先 做 置换 1， AM ,ty A/xo AM SIAYT SA Sm/Ynm|， 若 y;€ xl， 
x,| ， 则 从 上 述 集合 中 删 去 si ， 若 记 : A=x; 时 ， 从 上 述 集合 中 删 去 志 :AZ《x; ， 删 去 上 述 部 
分 ， 剩 余 的 元 素 所 构成 的 集合 称 为 6 与 A 的 乘积 ， 记 为 6.A。 
例如 ,设置 换 9= f(y)/x,z/y|， A=|a/x,b/y,y/z|， 求 9.AA。 
先 做 置换 1Ky) :A/x,z* A/y,a/x,b/y,y/z) = {fC0) /x,y/y ,a/x,b/y,y/z|, 
删除 a/x 和 6b/y， 
再 删除 y/y， 得 到 
0 A=|f(6)/x,y/z| 
3) 合 一 的 概念 。 设 有 谓词 公式 集 { G1 ,G6,,… ,6,| 和 置换 9, 使 61.9= 6,90=…=6G,96， 则 
称 G1 ,G,,…G, 是 可 合 一 的 ， 且 0 称 为 合 一 置换 。 
设 有 公式 集 G= | P(x,y,f(y) ) ,P(a,g(x) ,z)} ， 则 下 式 为 它 的 一 个 合 一 置换 . 
0= |a/x,g(a)/y,f( g(a) )/z| 
一 般 地 ， 一 个 公式 集 的 合 一 置换 是 不 唯一 的 。 
4) 最 一 般 合 一 置换 。 藻 Cl ，G,，…G 有 合 一 置换 ， 且 对 C; ，G,，…6。 的 任 一 置换 
9 都 存在 一 个 置换 A, 使 90=o .和 A， 则 称 o 是 G1，G,，,，…6G 的 最 一 般 合 一 置换 (most 
general unifier) ， 记 为 mgu。 
例如 , 设 Gl=Q(a,f(y))，G,=Q(x,b) 是 可 合 一 的 ， 其 合 一 置换 是 9= | a/x,b/f(y)|}， 
它 也 是 G| 和 6, 的 最 一 般 合 一 置换 mgu。 
又 如 , 设 Ci=O(y)，2 =0O(Cx) ) 是 可 合 一 的 ， 其 合 一 置换 是 9=1f(a)/y,a/x|, 但 9 
不 是 Gl 和 6G, 的 mgu, oo=|f(x)/y) 才 是 mgu， 即 mgu 是 G1 和 0G, 的 最 简单 的 合 一 置换 。 
根据 上 述 合 一 置换 的 思想 ， 设 有 如 下 两 个 子 句 : 
Ci=n P(x) VQ() 
C3=P(a) VRO) 
由 于 P(x) 和 P(a) 不 同 , 不 是 互补 文字 ， 不 能 对 C, 和 C, 直接 进行 归结 ， 作 如 下 合 一 
置换 : o=|a/x| ，o 是 mgu， 对 两 个 子 句 分 别 进行 置换 . 
Cig=- Pla) VQ(a) 
Cso=P(a) VR(Y) 
对 其 进行 归结 ， 消 去 ” P(a) 与 P(a)， 得 到 如 下 归结 式 
Q(a) VR(y) 
以 下 给 出 谓词 逻辑 中 ， 归 结 的 定义 。 
(2) 归结 的 定义 
设 C| 和 C, 是 两 个 没有 相同 变 元 的 子 句 ，L, 和 万 分别 是 C, 和 C, 中 的 文字 , 若是 亡 
和 =” 疡 的 最 一 般 合 一 置换 (mgu) ， 则 称 
Cp=(CCo-lDo)V(Cco-lDol) 
为 C 和 CC, 的 二 元 归结 式 。Z 和 是 被 归结 的 文字 。 
【 例 2-16】 设 C=-P(a)VQ(x)V- R(x)，Cs=P(y)V -0Q(5)， 求 其 二 元 归结 式 。 
若 选取 六 = P(a), =P(y), 则 co=|a/yl 为 Ll 和 氏 的 mgu， 得 到 
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CICO=nm Pl(a) VO(x) V- R(x) 
C=P(a) V- 0Q(2) 
根据 归结 的 定义 ,得 到 
C2=(Cio-{Lol)V (Co-|L,o0|) 
=(|- Pla) ,Q(x) Ri -I- Pla)l)V (IP(a),- 0(25)1-{P(a)|) 
=(|Q(x) ,7 R(x)})V (I- 0(2)1) 
= |Q(x),- R(x),- Q(5)| 
=QO(x) V- R(X) V- Q(2) 
若 选 取 工 =0(x)，L=-~- 0(b)，, 则 go=|65/x| ,得 
Cio=- P(a) VQ(b) V- R(L) 
C=P(y) V- Q(2) 
C2=(Cio-{Lio) )V (C0-|L0| ) 
=(|- P(a),0(6) ,7 RCD)Y-IQOC) I) VCP) nm OCT- OCT) 
=(|- Po R(b)I)V (NP(Y)!) 
= 1- Pa), R(b),P(Y)! 
= P(a) V- R(b) VP(y) 
对 于 一 阶 谓词 逻辑 ， 子 名 进行 归结 推理 时 ， 应 注意 以 下 几 个 问题 : 
1) 若 被 归结 的 子 句 C, 和 C, 中 具有 相同 的 变 元 时 ， 需 要 修改 其 中 一 个 子 句 的 变 元 名 
字 ， 和 否则 无 法 进行 合 一 置换 ， 从 而 无 法 进行 归结 。 
例如 ， 设 子 句 C; =” P(z)VO(a)，C=P(c)VRCz)， 由 于 C; 和 C, 具有 相同 的 变 元 ， 
不 能 直接 进行 归结 ， 此 时 ， 如 令 C,=P(c)VR(y)， 则 , Li=-~- P(x), =P(c), 取 o=|ce/ 
xl (C1 和 CC 的 mgu)， 则 
Cw=({- P(e) ,0(a)1-I- P(e)1) VC P(e) ,RGY) 1 -IP(e)!) 
= |Q(a),R(Y)| 
=Q(a) VR(Y) 
2) 如 果 在 参加 归结 的 子 句 内 部 有 可 合 一 的 文字 ， 则 在 归结 之 前 应 对 这 些 文字 先进 行 合 
一 ， 以 实现 这 些 子 句 内 部 的 化 简 。 
【 例 2-17】 已 知 子 名 C=0(x)VQ(f(a))VP(x)，C;=-- 0Q(y)VR(5b)，, 求 其 二 元 归结 式 。 
由 于 在 子 句 C; 中 有 可 合 一 的 文字 0(x) 和 0Q(f(a))， 若 用 最 一 般 合 一 9= |f(a)/x) 进 
行 置换 ， 可 得 








C10=Q(f(a)) VP(f(a)) 
再 对 C10 和 C, 进行 归结 。 选 取 o=f(a)/y (C19 和 CC, 的 mgu)， 则 
[1=0(f(a)), b=7 0(7) 
得 到 
C12=P(f(a)) VR(D) 
这 里 , 称 C10 为 Ci 的 因子 。 一 般 情 况 下 ， 阁 子 句 C 中 有 两 个 或 两 个 以 上 的 文字 具有 最 一 般 
的 合 一 置换 og， 则 称 Co 为 子 句 C 的 因子 。 如 果 Co 为 一 个 单 文字 ， 则 称 它 为 C 的 单元 因子 。 
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应 用 因子 的 概念 ， 可 对 一 阶 谓词 逻辑 中 的 归结 原理 定义 如 下 : 

定义 : 设 Cl 和 C, 是 没有 相同 变 元 的 子 句 ， 则 下 列 4 种 二 元 归结 式 称 为 Cl 和 GC, 的 归结 
式 ， 记 为 Co。 

@ Ci 与 C, 的 二 元 归结 式 ; 

@ Ci 的 因子 Cic 与 C, 的 二 元 归结 式 ; 

图 C1 与 C, 的 因子 C0 的 二 元 归结 式 ; 

@ Ci 的 因子 Cic 与 C, 的 因子 Ce 的 二 元 归结 式 。 

对 于 谓词 逻辑 ， 上 述 命题 逻辑 中 关于 “归结 式 是 其 亲本 子 句 的 逻辑 结论 ” 仍 适 用 。 将 
两 个 子 句 的 归结 式 加 入 到 原子 句 集 $ 中 ， 所 得 到 的 新 子 句 集 S| 和 $ 的 不 可 满足 性 是 一 致 的 。 

(3) 归结 原理 的 完备 性 ”对 于 一 阶 谓词 逻辑 ， 从 不 可 满足 意义 上 说 ， 归 结 原 理 是 完备 
的 。 即 若 子 句 集 $ 不 可 满足 ， 则 必然 存在 一 个 从 $ 到 空子 句 集 的 归结 演绎 ; 若 存在 一 个 从 $ 
到 空子 句 集 的 归结 演绎 ， 则 $ 一 定 是 不 可 满足 的 。 


2.4.4 利用 Robinson 归结 原理 实现 定理 证 明 


Robinson 归结 原理 给 出 了 证 明子 句 集 不 可 满足 的 方法 。 一 般 地 ， 在 定理 证 明 中 ， 常 见 的 
形式 为 : 








Pi AP, 人 …AP ,一 0 

这 里 ，P AP 人 … 人 和 人 己 是 前 提 条 件 ，0Q 是 逻辑 结论 。 根 据 反 证 法 延伸 的 归结 反 演 理论 ， 
只 需 证 明 ，(P AP 人 人 …A 人 忆 ,) An 0 是 不 可 满足 的 。 又 根据 本 节 关 于 一 阶 谓 词 公式 的 不 可 
满足 性 ， 只 需 证 明 该 谓词 公式 的 子 句 集 的 不 可 满足 性 即 可 。 因 此 ， 知 要 证 明 一 个 用 谓词 公式 
所 表示 的 定理 ， 只 需 按照 以 下 步骤 : 

Q 将 竺 证明 的 定理 用 一 阶 谓词 公式 表示 ， 形 如 Pj 人 P, A… 人 人 P, 一 0; 

@) 否定 逻辑 结论 0， 并 将 该 否定 式 - 0 与 前 提 重 组 为 以 下 形式 的 谓词 公式 : 

C=PIAPA 人 …AP An 0 

@) 求 谓词 公式 G 的 子 句 集 $; 

@ 应 用 归结 原理 对 子 句 集 $ 中 的 子 句 进行 归结 ， 并 把 每 次 归结 得 到 的 归结 式 加 入 到 $ 
中 ， 如 此 反复 执行 ， 若 出 现 了 空子 句 NIL, 停止 归结 ， 证 明了 子 句 集 $ 的 不 可 满足 性 ， 进 而 
证 明 谓 词 公式 G 的 不 可 满足 性 。 说 明 对 结论 0 的 否定 是 错误 的 ， 推 出 定理 的 正确 性 。 

应 用 归结 原理 证 明定 理 的 过 程 称 为 归结 反 演 。 

【 例 2-18】 已 知 两 个 谓词 公式 : 

A: (Vx)((3y)(PCx,y) AQ() DO 3y) (RC(Y) AT(x,y) )) 

B: 7 (jx) (R(X) VA) (Vy) (P(x,y) 7 0(7))) 

求证 : B 是 4 的 逻辑 结论 。 

证 明 : 首先 , 将 4 化 为 子 句 集 : 

由 连接 词 化 归 律 ， 消 去 蕴含 一 ， 得 到 . 

(Vx)(-= (3y)(P(x,y) MOC(Y)) VC AY) (RY) AT(x,Y))) 

将 否定 移 到 谓词 前 面 ， 得 到 

(Vx) (CVy)(H PX,y) V = QO(7)) VC Ay) CR(Y) AT(x,Y))) 
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由 于 存在 量词 出 现在 全 称 量词 的 辖 域 内 时 ， 引 入 Skolem 函数 f(x) 替换 y， 则 有 
(CVA Vy) Plasy) Y= GDVORRDJATOD) 
化 为 Skolem 范式 
(Va)(( VY) Px,y)V = QF) VROACK))) M(H Px,y) VN- QO(y)V Tx, f(x) ))) 
其 子 句 集 为 
Si1=|- P(x,y) V- QO(y) V R(x))| 
CR Re 
类 似 地 ， 将 ” B 化 为 子 句 集 : 
7 (7 (dx) (RO VA) VY) P(x,Y) 7 0(7)))) 
7 (7 (Ix) (RCO VX) CY) (= Px,y) V = 0(7)))) 
”CCYz)(CRGz) VCVZz) CVY) (= P(x,y) V- 0(7)))) 
(3z)(= ROCz) A Ir) 3y) (P(x,y) AQ(Y))) 


其 子 句 集 为 : 
S$"1=1- R(a)| 
3 2 = 1P(2,c)1 
S'3=|Q(c)) 
则 子 句 集 5 为 


(D- P(x,y) V- Q(y) VR(f(x)) 
© P(x,y) V- QO(y)V T(x ,f(x)) 
(3) - R(a) 
由 P(b,c) 
@ Q(0) 
下 面 进行 归结 : 
Cn P(x,y) V- 0(y) 与 @ 归 结 ,，o= |f(x)/al 
CD Qe) 与 @ 归 结 ,，o=|b/x,c/y| 
@ NIL 与 归结 
可 证 明子 句 集 5 的 不 可 满足 性 ，B 是 4 的 逻辑 结论 。 
证 毕 。 
【 例 2-19】 利用 归结 原理 证 明 
(Vx) (P(x) (QO(x) AR(x))) AC( Hx) (Px) AT(x))—( 3x) (T(x) AR(x)) 
证 明 .: 
否定 逻辑 结论 ( 3x) (T(x) 人 R(x) ) ， 并 将 该 否定 式 与 前 提 重 组 为 以 下 谓词 公式 : 
G=( Vx) (P(x) (0(x) AR(x))) A( Ir) (Pr) AT(x)) A= (3x) (T(x) AR(x)) 
由 于 谓词 公式 C 可 看 作 三 项 的 合 取 ， 可 对 每 一 项 分 别 求 子 句 集 : 
(Vx) (P(x)—(Q(x) AR(x))) 
Gi: = (Vx)(- P(x)V (Q(x) AR(x))) 
=(Vx)(- P(x) VQ(x)) A(- P(x) VR(x)) 
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G2: (3x) (P(x) ATCz)) 
G3: = (Ix) (Tx) AR(x))= (Vx) (= T(x) V- R(x)) 
子 句 集 分 别 为 : 
Si=inPx)VOx) PCx)VRCD)| 
= 

S3=|- T(x) V- R(x)| 
得 到 谓词 公式 G 的 子 句 集 为 : 
S=SiUS US =inPxz)VOG) ,PVROx) ,Pla),T(a),- T(x) V- R(x)| 
归结 推理 过 程 为 : 
(D - P(x) VO(x) 
©® - P(x) VR(x) 
(3) Pla) 
中 了 To) 
© - T(x) V- R(x) 
(© R(a) @ 和 @@ 归 结 , o= |a/x| 
D - R(a) 由 和 名 归结 , og= |a/x| 
@ NIL (@ 和 QD 归结 
故 子 句 集 $ 是 不 可 满足 的 ， 则 谓词 公式 G 为 不 可 满足 的 ， 命 题 得 证 。 
证 毕 。 
【 例 2-20】 设 有 如 下 知识 : 
(1) 能 编程 的 是 懂 程 序 语 言 的 ; 
(2) 大 象 不 懂 程 序 语言 ; 
(3) 有 些 大 象 是 很 聪明 的 ; 
用 归结 策略 证 明 : 有 些 很 聪明 的 并 不 能 编程 。 
证 明 : 首先 ， 定 义 如 下 谓词 : 
P(x) : x 能 编程 ; I(x) : x 懂 程 序 语言 ，S(x): x 是 聪明 的 ; M(x) : x 是 大 象 。 
其 次 ,将 已 知 知识 和 待 求 证 的 问题 用 谓词 公式 表示 出 来 : 





(Vx)(P (x)—1(%)) 能 编程 的 是 懂 程 序 语言 的 ; 
(Vx) (M(x)—- 1(%)) 大 象 不 懂 程 序 语言 ; 

( 3x) (M(x) ASCx) ) 有 些 大 象 是 很 聪明 的 ; 
(3x)(S(x) An P(x)) 有 些 很 聪明 的 并 不 能 编程 。 


否定 逻辑 结论 ， 将 上 述 谓词 公式 化 为 子 句 集 ， 则 
S1=1- P(x) VI(%)| 
$= |- M(x) V- 1(x)| 
$3={M(a),S(a)| 
S4=|n SGz) VP(z)| 
得 到 子 句 集 $ 为 : 
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S=SIUS US US = P(x) VI(x) ,= M(x) V- T(x),M(a),S(a),- S(z) VP(z)| 
应 用 归结 原理 进行 归结 : 

QD - P(x) VI(x) 

©@ - M(x) V- I(x) 


3) M(a) 

@ S(a) 

© - S(z) VP(z) 

© ~ I(a) @ 和 @ 归 结 , o= |a/x| 
® - Pla) QO 和 @ 归 结 , r= |a/x| 
@) P(a) @@ 和 @ 归 结 , o=|a/z| 
©@ NIL Q@ 和 @ 归 结 

故 子 句 集 $ 是 不 可 满足 的 ， 命 题 得 证 。 
证 毕 。 


【 例 2-21】 试 证 明理 发 师 悖 论 : 大 每 个 理发 师 都 为 不 能 给 自己 理发 的 人 理发 ， 且 每 个 
理发 师 都 不 为 能 给 自己 理发 的 人 理发 ， 则 不 存在 任何 理发 师 。 
证 明 : 首先 ， 定 义 如 下 谓词 : 
HC(x) : x 是 理发 师 ; C(x,，y): x 给 y 理 发， S(x) :x 能 给 自己 理发 ; 
其 次 ， 将 已 知 知识 和 待 求 证 的 问题 用 谓词 公式 表示 出 来 : 
(Vx) (HC(x)—(C(x, y) An S(y))) 每 个 理发 师 都 为 不 能 给 自己 理发 的 人 理发 ; 
(Vx)(HC(x) 一 (= C(x, y)AS(y))) 每 个 理发 师 都 不 为 能 给 自己 理发 的 人 理发 ; 
nm” (x)HC(x) 不 存在 任何 理发 师 ; 
否定 逻辑 结论 ， 将 上 述 谓词 公式 化 为 子 句 集 ， 则 
Si=inECx)VCGxy) ,= HC(x) V = S(y)| 
Ss=|- HC(x) V- C(x,y),— HC(x) VS(y)!| 





S3= 1HC(a)| 
得 到 子 句 集 $ 为 : 

S=SIUS, US 
应 用 归结 原理 进行 归结 : 
DD- HC(x) VC(x,y) 
© HC(x) V- S(y) 
@ - HC(x) V+ C(x,y) 
@ - HC(x) VS(y) 
@ HC(a) 
© - S(y) @ 和 @ 归 结 , o=|a/x| 
CO S(y) @ 和 @@ 归 结 , rc = | ovx| 
NIL (@ 和 Q@ 归 结 


故 子 句 集 $ 是 不 可 满足 的 ， 命 题 得 证 。 
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2.4.5 应 用 归结 原理 求解 问题 


应 用 归结 原理 不 仅 可 以 实现 定理 证 明 ， 还 可 以 用 来 求解 问题 的 答案 ， 其 思想 与 定理 证 明 
相 类 似 。 以 下 给 出 应 用 归结 原理 求解 问题 答案 的 步骤 : 

1) 把 已 知 前 提 用 谓词 公式 表示 出 来 ， 并 且 化 为 相应 的 子 句 集 ， 设 该 子 句 集 为 5; 

2) 把 竺 求解 的 问题 用 谓词 公式 表示 出 来 ， 然 后 把 它 和 否定 ， 并 与 谓词 ANSWER 构成 析 取 
式 ，ANSWER 是 一 个 为 求解 问题 而 专 设 的 谓词 ， 其 变 元 必须 与 问题 公式 中 的 变 元 完全 一 致 ; 

3) 把 2) 中 得 到 的 析 取 式 化 为 子 句 集 ， 并 把 该 子 句 集 并 和 人 到 子 句 集 $ 中， 得 到 子 句 
集 S 

4) 应 用 归结 原理 对 $' 进 行 归 结 ; 

5) 若 得 到 归结 式 ANSWER， 则 答案 就 在 4VSTER 中 。 

【 例 2-22】 已 知 下 列 事实 : 

1) Mark 是 Anne 的 导师 ; 

2) Anne 是 John 的 同门 ; 

3) 如 果 x* 与 y 是 同门 ， 则 x 的 导师 也 是 y 的 导师 。 

试 求 ，John 的 导师 是 谁 

解 : 首先 ， 定 义 如 下 谓词 : 

T(x,y) :x 是 y 的 导师 ，S(x,y): x 和 yy 是 同门 ; 

其 次 ， 将 已 知 知识 用 谓词 公式 表示 出 来 : 

T (Mark, Anne) Mark 是 Anne 的 导师 ; 

C (hnne，John) Anne 是 John 的 同门 ; 

(Vx) (Vy)CVz) (C(x,y) AT(z,x)—T(z,y) ) 如 果 « 与 y 是 同门 ， 则 % 的 导师 也 是 7 
的 导师 ; 

将 上 述 谓词 公式 化 为 子 句 集 : 

Si={- C(x,y) V- T(z,x) VT(z,y),T( Mark,Anne) ,C( Anne, John)| 
将 待 求证 的 问题 用 谓词 公式 表示 出 来 ， 并 将 其 否定 与 谓词 ANSWER 作 析 取 : 
- (dx)T(x,John) VANSWER(x) 
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化 为 子 句 集 : 

S,=|- T(a,John) VANSWER(a) | 
将 S 和 5S, 合并 到 5， 则 

S=S1 US, 

应 用 归结 原理 进行 归结 : 
D-C x, y) Vn7T(z x) VT (z, y) 
@7T (Mark, Anne) 
G@) C (Anne, John) 
@-T (a, John) VANSWER (a) 
-CC (Anne, y) VT (Mark, y) GD 和 @) 归 结 ，o = | Mark/z,Anne/x| 


《42) 
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©-C (Anne, John) VANSWER (Mark) @ 和 加 归结 ,og= | John/y,Mark/al 
@ ANSWER (Mark) 地 和 和 上 归结 

即 得 到 了 归结 式 ANSWER (Mark)， 知 John 的 导师 是 Mark。 

上 述 过 程 的 归结 树 表 示 如 图 2-3 所 示 。 


CE DV A VI 







—C(Anne, WVT(Mark,y) —T(a, John)V ANSWER (a) 


—C(Anne, John)VANSWER (Mark) C(Anne ,John) 





图 2-3 ”归结 树 表 示 


2.5 产生 式 系统 











产生 式 系统 (Production System) 是 美国 数学 家 波斯 特 (上 .Post) 于 1943 年 首次 提出 
的 ， 其 将 一 组 表示 知识 的 产生 式 放 在 一 起 ， 让 它们 互相 配合 、 协 同 作 用 ， 其 中 一 个 产生 式 的 
结论 可 以 供 另 一 个 产生 式 作为 已 知事 实 使 用 ， 以 求 得 问题 的 解 ， 称 为 “产生 式 系统 ”。 

产生 式 表 示 法 又 称 为 产生 式 规 则 (Production Rule) 表示 法 ， 是 一 个 以 “如 果 满 足 这 个 
条 件 ， 就 应 当 采 取 某 些 操作 ”的 语句 。 目 前 ， 这 一 方法 已 经 成 为 AI 中 应 用 最 多 的 一 种 知识 
表示 模型 ， 许 多 成 功 的 专家 系统 都 采用 这 种 方法 来 实现 知识 的 表示 。 如 Stanford 大 学 费 根 鲍 
姆 等 人 研制 的 化 学 分 子 结构 专家 系统 DENDRAL，Stanford 大 学 肖 特 里 菲 等 人 研制 的 诊断 传 
染 性 疾病 的 专家 系统 MYCIN。 

产生 式 表 示 法 适合 于 表示 事实 性 和 规则 性 知识 ， 具 体 地 ， 可 划分 为 : 

1. 确定 性 规则 知识 的 产生 式 表 示 : 

















基本 形式 为 : 

IF P THEN 0Q 
或 者 : 

Po0 


其 中 , P 是 产生 式 的 前 提 ， 用 于 指出 该 产生 式 是 否 可 用 的 条 件 ; 0 是 一 组 结论 或 操作 ， 
用 于 指出 当前 提 条 件 己 所 示 的 条 件 被 满足 时 ， 应 该 得 出 的 结论 或 应 执行 的 操作 。 整 个 产生 
式 的 含义 为 : 如 果 前 提 P 被 满足 ， 则 可 0 或 执行 8 所 规定 的 动作 。 例 如 : 

rule: IF ”该 动物 有 毛发 。 THEN 该 动物 是 哺乳 动物 

这 里 ,，“ 该 动物 有 毛发 ”是 前 提 P,“ 该 动物 是 哺乳 动物 ”是 结论 0。 
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2. 不 确定 性 规则 知识 的 产生 式 表示 : 


基本 形式 为 : 
IF P THEN 0 (置信 和 度 ) 
或 者 : 


P 一 0 (置信 度 ) 

这 里 ， 置 信和 度 (Certainty Factor) 的 引入 ， 是 表示 在 不 确定 推理 中 ， 当 已 知事 实 与 前 提 
中 所 规定 的 条 件 不 能 精确 匹配 时 ， 只 要 按照 “置信 度 ” 的 要 求 达 到 一 定 的 相似 度 ， 就 认为 
已 知事 实 和 前 提 条 件 相 匹配 ， 再 按照 一 定 的 算法 将 这 种 可 能 性 (或 不 确定 性 ) 传递 到 结论 。 
例如 ， 在 专家 系统 MYCIN 中 有 这 样 一 条 产生 式 : 

IF 本 微生物 细菌 的 染色 斑 为 草 兰 氏 阴 性 ，; 

本 微生物 的 形态 呈 杆 状 ; 
本 微生物 生长 需 氧 ; 

THEN 该 细菌 是 肠 杆 菌 属 ， 置 信和 度 为 0.6 

它 表示 当前 提 中 所 列 出 的 条 件 都 满足 时 ,结论 “该 细菌 是 肠 杆菌 属 ” 可 以 相信 的 程度 是 0.6。 

3. 确定 性 事实 性 知识 的 产生 式 表 示 

般 用 三 元 组 表示 : (对 象 ， 属性， 值 ) 

或 者 : (关系 ， 对 象 1， 对 象 2) 

例如 ， 电 脑 5000 元 钱 ， 表 示 为 (Computer，Price，5000)。 

Mary 和 Ben 是 朋友 ， 表 示 为 (Friend, Mary, Ben)。 

4. 不 确定 性 事实 性 知识 的 产生 式 表 示 

一 般 用 四 元 组 表示 : (对 象 ， 属 性 ， 值 ， 置 信和 度 ) 

或 者 : (关系 ， 对 象 1， 对 象 2， 置 信和 度 ) 

例如 上 例 ， 电 脑 可 能 是 5000 元 钱 ， 表 示 为 (Computer,，Price，5000，0. 8)。 

Mary 和 Ben 不 太 可 能 是 朋友 ， 表 示 为 (Friend, Mary, Ben, 0.1)。 

产生 式 与 谓词 逻辑 中 的 蕴含 式 的 基本 形式 相同 ,但 两 者 有 明显 的 区 别 . (D 蕴 含 式 只 能 表 
示 精 确 性 的 知识 ， 其 真 值 或 者 为 真 ， 或 者 为 假 。 而 产生 式 还 可 以 表示 不 精确 性 的 知识 ， 没 有 
真 值 。 即 ， 列 含 式 只 是 产生 式 的 一 个 特殊 情况 ; @ 当 决定 一 条 知识 是 否 可 用 时 ， 需 要 检查 当 
前 是 否 存在 已 知事 实 与 前 提 所 规定 的 条 件 相 匹配 。 对 于 蕴含 式 ， 要求 匹 配 总 是 要 精确 的 。 但 
对 于 产生 式 ， 匹 配 还 可 以 是 不 精确 的 ， 只 要 按 某 种 算法 求 出 的 相似 度 落 在 预先 指定 的 范围 内 
就 认为 是 可 匹配 的 。 


2. 5. 1 产生 式 系统 的 组 成 部 分 


如 前 所 述 ， 把 产生 式 当 作 AI 系统 中 的 一 个 基本 的 知识 单元 ， 将 一 组 这 样 的 知识 单元 放 
在 一 起 ， 让 它们 互相 配合 、 协 同 作用 ， 构 成 产生 式 系 


统 ， 成 为 问题 求解 的 一 种 模式 。 
一 般 来 让 i “系统 由 三 部 分 组 成 局 当 
般 来 说 ， 产 生 式 系统 由 三 部 分 组 成 ， 即 全 局 数 Feel 二 


据 库 (Global Database ) 、 产 生 式 规则 (Sets of Rules ) 加 - 
和 控制 策略 ( Control Strategies) 组 成 。 各 部 分 的 关系 We 
如 图 2-4 所 示 。 
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1. 全 局 数据 库 

全 局 数据 库 又 称 为 综合 数据 库 、 事 实 库 、 上 下 文 、 黑 板 等 ， 用 于 存放 求解 过 程 中 各 种 当 
前 信息 的 数据 结构 ， 如 问题 的 初始 状态 、 事 实 或 证 据 、 中 间 推 理 结论 和 最 后 结果 等 。 当 产生 
式 规则 中 某 条 规则 的 前 提 与 全 局 数据 库 中 的 某 些 事实 相 匹配 时 ， 该 规则 就 被 激活 ， 并 把 结论 
作为 新 的 事实 存 人 全 局 数据 库 。 

2. 产生 式 规则 

产生 式 规则 是 一 个 规则 库 ， 用 于 存放 与 求解 问题 有 关 的 某 个 领域 知识 规则 的 集合 及 其 交 
换 规则 。 

3. 控制 策略 

控制 策略 为 一 个 推理 机 构 ， 由 一 组 解释 程序 组 成 ， 其 作用 是 用 来 控制 产生 式 系统 的 运 
行 ， 决 定 问题 求解 过 程 的 推理 线路 。 通 常情 况 下 ， 从 选择 规则 到 执行 操作 分 3 步 完成 ， 即 匹 
配 、 冲 突 解决 和 操作 。 


2. 5.2 产生 式 系统 的 控制 策略 


1. 匹配 
所 谓 匹 配 就 是 把 规则 的 前 提 条 件 与 全 局 数据 库 中 的 已 知事 实 进行 比较 ， 如 果 两 者 一 致 ， 
或 者 近似 一 致 ， 则 称 为 匹配 成 功 ， 相 应 的 规则 可 以 被 使 用 ; 否则 称 为 匹配 不 成 功 。 当 按 规则 
的 操作 部 分 去 执行 时 ， 称 这 条 规则 为 启用 规则 。 
2. 冲突 解决 
被 触发 的 规则 不 一 定 总 是 启用 规则 ， 因 为 可 能 匹配 的 规则 不 只 一 条 ， 这 种 情况 称 为 发 生 
了 冲突 。 该 选择 并 执行 哪 一 条 规则 ， 就 称 为 “规则 冲突 解决 " 。 冲 突 解决 策略 包括 : 
(1) 专 一 性 排序 (Specificity Ordering) 如 果 某 一 规则 中 条 件 部 分 规定 的 情况 ， 比 另 一 
规则 中 条 件 部 分 规定 的 情况 更 有 针对 性 ， 则 这 条 规则 有 较 高 的 优先 级 。 例 如 
某 高 校对 博士 毕业 生发 表 论 文 的 要 求 : 
Ri: ”IF ”至 少 在 国内 核心 刊物 上 发 表 (或 录用 ) 3 篇 学 术 论 文 
且 至 少 被 SCI 或 本 收录 1 篇 学 术 论文 
THEN 视 为 满足 博士 毕业 发 表 学 术 论文 条 件 
R,: IF ”至 少 在 国内 核心 刊物 上 发 表 (或 录用 ) 3 篇 学 术 论 文 
且 至 少 被 SCI 或 EI 收录 1 篇 学 术 论 文 
且 3 篇 学 术 论文 中 ，FEI 检索 的 国际 会 议 文章 多 于 1 篇 时 ， 仅 视 为 1 篇 
THEN 视 为 满足 博士 毕业 发 表 学 术 论文 条 件 
如 果 当 前 数据 库 中 包含 事实 : 如 果 至 少 在 国内 核心 刊物 上 发 表 (或 录用 ) 3 篇 学 术 论 
文 ， 且 至 少 被 SCI 或 卫 收 录 1 篇 学 术 论 文 ， 则 上 述 两 条 规则 都 被 触发 ， 这 就 需要 用 冲突 解 
决 来 决定 首先 使 用 哪 一 条 规则 。 由 于 R, 的 条 件 部 分 包括 了 更 多 的 限制 ， 因 此 规定 了 一 个 更 
为 特殊 的 情况 。 根 据 专 一 性 排序 规则 ，R, 具有 较 高 的 优先 级 。 
(2) 规则 排序 (Rule Ordering) ”如 果 规 则 编排 的 顺序 就 表示 了 启用 的 优先 级 ， 则 称 之 
为 规则 排序 。 
(3) 规模 排序 (Scale Ordering)” 按 规则 的 条 件 部 分 的 规模 排列 优先 级 ， 优 先 使 用 被 满 
足 的 条 件 较 多 的 规则 。 
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(4) 就 近 排 序 (Nearby Ordering) ”把 最 近 使 用 的 规则 放 在 最 优先 的 位 置 。 这 和 人 
类 的 行为 有 相似 之 处 。 如 果 某 一 规则 经 常 被 使 用 ， 则 人 们 倾向 于 更 多 地 使 用 这 条 
规则 。 

(5) 数据 排序 (Data Ordering) ”把 规则 中 条 件 部 分 的 所 有 条 件 按 优先 级 次 序 编排 起 来 ， 
运行 时 首先 使 用 在 条 件 部 分 包含 较 高 优先 级 数据 的 规则 。 

(6) 上 下 文 限制 ”把 产生 式 规则 按 它们 所 描述 的 上 下 文 分 组 ， 也 就 是 说 按 上 下 文 对 规 
则 分 组 。 在 某 种 上 下 文 条 件 下 ， 只 能 从 与 其 相对 应 的 那 组 规则 中 选择 可 应 用 的 规则 。 

对 于 AI 系统 ， 如 何 选择 冲突 解决 策略 完全 是 启发 式 的 。 

3. 操作 

操作 就 是 执行 规则 的 操作 部 分 ， 经 过 操作 后 ， 当 前 数据 库 将 被 修改 ， 其 他 的 规则 有 可 能 
成 为 局 用 规则 。 


2.5.3 产生 式 系统 的 推理 方式 


按照 搜索 方向 ， 产 生 式 系 统 的 推理 方式 包括 正 向 推理 、 反 向 〈 逆 向 ) 推理 和 双向 推理 
3 种。 

1. 正 向 推理 

正 向 推理 又 称 为 事实 〈 或 数据 ) 推理 、 前 向 链接 推理 等 。 正 向 推理 从 一 组 表示 事实 的 
谓词 或 命题 出 发 ， 通 过 使 用 一 组 产生 式 ， 用 以 证 明 该 谓词 公式 或 命题 是 否 成 立 。 例 如 ， 有 规 
则 集 Rj ~ Ra : 

有 :Qi 一 2 

R,: oO2 一 03 

R;: 0 一 4 

其 中 ，0Q1~04 为 谓词 公式 或 命题 。 假 


设 全 局 数据 库 已 经 存在 事实 O, ， 则 可 应 用 Ce: ) es Ce ) 规则 3 推出 
规则 R、R, 和 Rs 进行 正 向 推理 ， 其 过 程 也 


ES A 图 2-5 “ 正 向 推理 过 程 
2. 反 向 推理 


反 疝 推理 又 称 为 目标 驱动 推理 、 首 向 





































































































链接 推理 。 反 向 推理 从 表示 目标 的 谓词 或 命题 出 发 ， 使 用 一 组 产生 式 规则 证 明 事实 谓词 或 合 
题 成 立 ， 即 首先 提出 一 批 假 设 目标 ， 然 后 逐一 验证 这 些 假设 。 仍 利用 上 述 规则 Ri/ 、R, 和 
3. 双向 推理 
双向 推理 又 称 为 正 反 向 混合 推理 。 其 
和 以 正 向 从 事实 向 目标 推理 ， 并 在 推理 过 一 一 ~ 结论 C， 
程 中 的 某 个 步骤 ， 实现 事实 和 目标 的 匹配 。 图 2-6 反 向 推理 过 程 
美国 Stanford 研究 所 AI 中 心 研 制 的 基于 规则 的 专家 系统 工具 KAS， 就 是 采用 双 问 推理 
的 产生 式 系统 的 一 个 典型 例子 。 


R;， 其 过 程 如 图 2-6 所 示 。 

oo 规则 3 目标 
推理 策略 是 同时 以 反 向 从 目标 向 事实 推理 台 0 ; 0, 
双向 推理 的 过 程 如 图 2-7 所 示 。 
(46) 
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< 规则 假设 
事实 规则 1 | (n-1) 目标 
9 | On 
二 十 二 


| 
| 
匹配 








图 2-7 双向 推理 过 程 











2.6 语义 网 络 表示 法 


语义 网 络 是 1968 年 奎 联 (J. R. Quaillian) 在 研究 人 类 联想 记忆 时 提出 的 一 个 心理 学 模 
型 。1972 年 ，Simon 正式 提出 语义 网 络 的 概念 ， 讨 论 了 它 与 一 阶 谓词 的 关系 ， 并 将 语义 网 络 
表示 法 用 于 自然 语言 理解 系统 。 


2.6.1 语义 网 络 的 结构 


语义 网 络 是 知识 的 一 种 结构 化 图 解 表 示 ， 由 节点 和 弧 线 ( 链 线 ) 
组 成 。 一 个 最 简单 的 语义 网 络 可 由 一 个 三 元 组 (节点 1， 弧 ， 节 点 2) 
表示 ， 其 图 形 如 图 2-8 所 示 。 

把 多 个 基本 网 元 用 相应 的 语义 联系 关联 在 一 起 时 ， 就 得 到 一 个 语 
义 网 络 ， 如 图 2-9 所 示 。 

一 个 三 元 组 (节点 1, 驱 ,节点 2) 可 写成 P (个 体 1, 个 体 2)，, 其 中 个 体 1、 个体 2 
分 别 对 应 节点 1、 节 点 2， 而 弧 及 其 上 标注 的 节点 1 和 节点 2 的 关系 由 谓词 来 体现 ， 如 . 
知识 “安德鲁 和 玛丽 是 朋友 ”可 以 表示 为 一 阶 谓词 形式 : Friends (Andrew, Mary), 对 应 的 
语义 网 络 如 图 2-10 所 示 。 














图 2-8 基本 网 元 











Friends 


图 2-9 语义 网 络 结构 图 2-10 “安德鲁 和 玛丽 是 朋友 ” 
的 语义 网 络 表示 





2. 6.2 基本 命题 的 语义 网 络 表 示 
语义 联系 的 种 类 多 种 多 样 ， 内 容 广 泛 丰 富 ， 以 下 给 出 一 些 经 常 使 用 、 已 被 普遍 接受 的 基 
本 语义 联系 。 


《47) 
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(1) 类 属 关系 ” 指 具 有 共同 属性 的 不 同事 物 间 的 层次 分 类 、 成 员 关 系 或 实例 关系 。 体 
现 的 是 “具体 与 抽象 ”“ 个 体 与 集体 ”的 层次 分 类 。 

ISA: 含义 为 “是 一 个 ” (is-a) ， 表 示 一 个 事物 是 另 一 个 事物 的 实例 。 如 : 鹦 囊 是 一 只 
鸟 ， 表 示 如 图 2-11 所 示 。 

AMO: 含义 为 “是 一 名 ” ( A-Member-0f) ， 表 示 一 个 事物 是 另 一 个 事物 的 成 员 。 如 : 
Lyman 是 一 名 演员 ; 表示 如 图 2-12 所 示 。 











更 网 | SA 
图 2-11 “ 鹦 赵 是 一 只 鸟 ” 的 语义 网 络 表示 图 2-12 “1yman 是 一 名 演员 ”的 语义 网 络 表示 





AKO; 含义 为 “是 一 种 ”( A-Kind-0f) ， 表 示 一 种 事物 是 另 一 种 事物 的 类 型 。 如 图 2-13 
所 示 动 物 分 类 系统 。 





AKO AKO 
哺乳 动物 鸟 类 动物 








| | ed AKO AKO AKO 
时 | = 加 | 


图 2-13 “动物 分 类 系统 ”的 语义 网 络 和 对 





在 属性 关系 中 ， 具 体 结 点 具有 抽象 结 点 的 所 有 属性 ， 这 些 共享 属性 不 在 节点 上 重复 ， 减 
少 了 对 存储 的 要 求 。 还 可 以 增加 一 些 自己 的 个 性 ， 甚 至 能 够 对 抽象 层 节点 的 某 些 属性 加 以 
修改 。 

(2) 包含 关系 ， 也 叫 聚 类 关系 ， 或 聚集 关系 ， 是 指 具 有 组 织 或 结构 特征 的 “部 分 与 整 
体 ” 之 间 的 关系 。 与 类 属 关系 的 主要 区 别 为 : 不 具备 属性 的 继承 性 。 

Part-of: 含义 为 “是 一 部 分 ”， 表 示 一 个 事物 是 另 一 个 事物 的 一 部 分 。 如 : 概率 论 是 统计 
学 的 一 部 分 。 表 示 如 图 2-14 所 示 。 

其 中 ,“ 概 率 论 ”不 一 定 具 有 “统计 学 ”的 某 些 属性 。 

(3) 占有 关系 ee “具有 ” 














Have: 含义 为 “有 ”， 表 示 一 个 节点 拥有 男 一 个 节点 表示 的 事物 。 如 :Anna 有 一 个 姐 
姐 。 表 示 如 图 2-15 所 示 。 
图 2-14 “概率 论 是 统计 学 的 一 部 分 ” 图 2-15 “Anna 有 一 个 姐姐 ”的 
的 语义 网 络 表示 语义 网 络 表 示 


(4) 时 间 关 系 ， 指 不 同事 物 在 其 发 生 时 间 方 面 的 先后 次 序 关 系 ， 节 点 的 属性 不 具有 继 
承 性 ， 常 用 的 时 间 关 系 有 三 种 : 
Before: 含义 为 “在 前 ”， 表 示 一 个 事物 在 为 一 个 事物 之 前 发 生 ;， 如 : 五 比 Zhang 先 毕 
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业 ， 表 示 如 图 2-16 所 示 。 
After: 含义 为 “在 后 ”， 表 示 一 个 事物 在 另 一 个 事物 之 后 发 生 ; 如 Zhaneg 比 五 后 到 教 
室 ， 表 示 如 图 2-17 所 示 。 








Before Zhang 到 教室 After Li 到 教室 
图 2-16 “Li 比 Zhang 先 毕 业 ” 图 2-17 “Zhang 比 Li 后 到 教室 ” 
的 语义 网 络 表示 的 语义 网 络 表示 











During: 含义 为 “在 … 期 间 ”， 表 示 某 一 事物 或 动作 在 某 时 间 段 内 发 生 ; 如 : Linda 在 读 
研 期 间 结 婚 ， 表 示 如 图 2-18 所 示 。 

(5) 位 置 关系 ， 指 不 同事 物 位 置 方面 的 关系 ， 节 点 的 属性 不 具有 继承 性 ， 和 常用 的 位 置 
关系 有 : 

Located-on: 含义 为 “在 上 ”， 表 示 某 一 物体 在 另 一 个 物体 之 上 ; 

Located-at: 含义 为 “在 ”， 表 示 某 一 物体 在 某 一 位 置 ，; 

Located-under: 含义 为 “在 下 ”， 表示 某 一 物体 在 男 一 个 物体 之 下 ，; 

Located-inside: 含义 为 “在 内 ”， 表 示 某 一 物体 在 另 一 个 物体 之 内 ; 

Located-outside: 含义 为 “在 外 ”， 表 示 革 一 物体 在 另 一 个 物体 之 外 ; 

如 : 迪斯尼 乐园 位 于 香港 大 屿 山 ， 表 示 如 图 2-19 所 示 。 


During Disney land Located—at 香港 大 帖 山 















































图 2-18 “Linda 在 读 研 期 间 结 到 2-19 “迪斯尼 乐园 位 于 香港 大 
婚 ” 的 语义 网 络 表示 屿 山 ” 的 语义 网 络 表 示 








(6) 相近 关系 ” 指 不 同事 物 在 形状 、 内 容 方面 相似 或 接近 ， 和 常用 的 相近 关系 有 两 种 : 

Similar-to: 含义 为 “相似 ”， 表 示 一 个 事物 与 另 一 个 事物 相似 ; 如 : 猫 似 虎 ， 表 示 如 图 
2-20 所 示 。 

Near-to: 含义 为 “接近 ”， 表 示 一 个 事物 与 男 一 个 事物 接近 ; 如 : 办 公 楼 接近 江 边 ， 表 
示 如 图 2-21 所 示 。 








Similar—to Near—to 江 边 
图 2-20 “ 猫 似 虎 ”的 语义 网 络 表示 图 2-21 “办 公 楼 接近 江 边 ”的 语义 网 络 表示 


(7) 推论 关系 ， 指 从 一 个 概念 推出 另 一 个 概念 的 语义 联系 ， 如 : 早上 上 课 经 常 迟到 可 
推出 晚上 休息 晚 ， 表 示 如 图 2-22 所 示 。 

(8) 因果 关系 ， 指 由 某 一 事物 的 发 生 而 导致 另 一 事物 的 发 生 ， 适 于 表示 规则 性 知识 ， 
常用 Hf-then 联系 表示 两 个 节点 间 的 因果 关系 ,含义 为 “如 果 4， 那 么 B”， 表 示 如 图 2-23 
所 示 。 





























推出 [晚上 休息 哆 -then 
图 2-22 “早上 上 课 经 常 迟到 可 图 2.23 “如 果 A4, 那么 B* 
出 晚上 休息 晚 ” 的 语义 网 络 表示 的 语义 网 络 表 示 
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(9) 组 成 关系 ”是 一 种 一 对 多 的 
语义 联系 ， 表 示 某 一 事物 由 其 他 一 些 
事物 构成 ， 通 常用 “Composed-of” 联 
系 表 示 ， 节 点 间 属 性 不 具有 继承 性 。 
如 : 整数 由 正 整 数 、 负 数 及 零 组 成 ， 
表示 如 图 2-24 所 示 。 

(10) 属性 关系 ”表示 一 个 节点 是 图 2-24 “整数 由 正 整数 、 负 数 及 零 组 成 ”的 语义 网 络 表示 
另 一 个 节点 的 属性 ， 常 用 “1IS” 联 系 
表示 。 如 : 雪 是 白色 的 。 表 示 如 图 2-25 所 示 。 

语义 联系 不 局 限于 上 述 10 种 ,在 使 用 语义 网 络 时 ， 可 以 根据 具体 需要 ， 对 事物 间 的 各 
种 语义 联系 人 为 定义 。 


2.6.3 语义 网 络 的 知识 表示 方法 


从 下 述 三 个 方面 ， 对 语义 网 络 的 知识 表示 方法 进行 讨论 ， 分 别 是 : 事实 性 知识 的 表示 、 
情况 和 动作 的 表示 以 及 逻辑 关系 的 表示 。 

(1) 事实 性 知识 的 表示 “事实 性 是 指 有 关 领 域内 的 概念 、 事 实 、 事 物 的 属性 、 状 态 及 
其 关系 的 描述 。 如 : 雪 是 白色 的 ， 其 语义 网 络 除 了 可 以 用 类 属 关系 描述 外 ， 还 可 以 表示 为 如 
图 2-26 形式 。 


Positive Integral 












Composed—of 

















图 2-25 “ 雪 是 白色 的 ”的 语义 网 络 表示 图 2-26 “ 雪 是 白色 的 ”的 语义 网 络 表 示 





又 如 关于 “动物 的 语义 网 络 ”， 如 图 2-27 所 示 。 








有 生命 
能 运动 动物 有 繁殖 能 力 
AKO AKO 
食肉 哺乳 动物 | 有 毛发 。 会 飞行 有 羽毛 
AKO AKO 








有 扑 嗅觉 灵敏 。 红 先 食 谷类 








AKO AKO AKO AKO 
温顺 牧羊 大 毛发 厚 家 鸡 


身材 娇小 体形 大 生活 在 山 间 圈养 
图 2-27 动物 的 语义 网 络 结构 
概念 的 语义 网 络 具 有 继承 性 ， 即 哺乳 动物 和 鸟 类 动物 继承 了 动物 “有 生命 “能 运动 ” 
和 “有 繁殖 能 力 ” 的 属性 ， 两 者 还 具有 自身 的 特性 ， 如 哺乳 动物 具有 “食肉 ”和 “有 毛 


《50) 





第 2 章 知识 表示 和 推理 @@ 


发 ”的 属性 ， 乌 类 动物 具有 “会 飞行 ”和 “有 羽毛 ”的 属性 。 类 似 地 ， 狗 作为 哺乳 动物 的 
下 层 概念 ， 继 承 了 后 者 的 所 有 属性 ， 下 层 的 金毛 和 牧羊 犬 继承 了 狗 的 所 有 属性 ， 并 分 别 具 有 
自身 的 特性 。 鸡 作为 鸟 类 动物 的 下 层 概 念 ， 继 承 了 后 者 的 所 有 属性 ， 下 层 的 山 鸡 和 家 鸡 继承 
了 鸡 的 所 有 属性 ， 并 分 别 具 有 上 自身 的 特性 。 

(2) 情况 和 动作 的 表示 “对 于 某 些 复杂 的 知识 (含有 情况 或 动作 ) ， 仅 靠 节 点 表示 一 个 
事物 很 难 完 成 知识 的 表示 ，Simon 提出 增加 表示 情况 或 动作 的 节点 ， 即 节点 不 仅 可 以 表示 一 
个 物体 或 一 组 物体 ， 还 允许 其 表示 情况 或 动作 。 

1) 情况 的 表示 。 例 如 ， 应 用 具有 情况 节点 的 网 络 表示 知识 “ 王 老 师 从 2 月 到 7 月 讲 
“网 络 技术 ”课程 ”， 如 图 2-28 所 示 。 


AMO 讲授 者 




















时 间 


结束 于 [十 月 份 是 








AKO 
情况 
图 2-28 具有 情况 节点 的 语义 网 络 





图 中 设立 了 “讲课 ”节点 ， 表 示 一 个 特定 的 情况 (Situation) 。 从 该 节点 向 外 引出 一 组 
弧 ， 用 于 指出 讲授 者 、 讲 课 内 容 、 开 始 时 间 (Start-time) 、 结 束 时 间 (End-time) 和 AKO 属 
性 。 如 果 没 能 将 “讲课 ”作为 一 个 节点 ， 而 只 是 将 其 标注 于 一 条 弧 上 ， 如 图 2-29 所 示 的 语 
义 网 络 ， 则 无 法 将 开始 时 间 和 结束 时 间 在 网 络 中 表示 出 来 。 

2) 动作 和 事件 的 表示 。 当 所 要 表示 的 知识 中 ， 既 有 动作 的 主语 ， 又 有 直接 宾语 和 间接 
宾语 时 ， 可 以 将 动作 设立 成 一 个 节点 ， 也 可 以 把 发 生 的 动作 作为 一 个 事件 ， 设 立 为 一 个 事件 
节 上 点。 例如， 知识“ 王 老 师 给 计算 机 应 用 专业 讲 “ 网 络 技术 ”课程 ”， 可 表示 为 如 图 2-30 
所 示 。 














EI ET 到 [学 生 | 于 于 轴 应 有 


图 2.29 不 具有 情况 节点 的 语义 网 络 图 2-30 ” 带 有 动作 节点 的 语义 网 络 


-~ 


如 果 将 “ 王 老 师 给 计算 机 应 用 专业 讲 “ 网 络 技术 ”课程 ”作为 一 个 事件 ， 在 语义 网 络 
中 增加 一 个 “事件 ”节点 ， 则 表示 如 图 2-31 所 示 。 

综合 上 述 两 种 类 型 ， 表示 知 识 “ 王 老师 从 2 月 到 7 月 给 计算 机 应 用 专业 讲 “ 网 络 技术 
课程 ”， 如 图 2-32 所 示 。 

图 中 设立 了 “讲课 ”节点 ， 表 示 一 个 特定 的 情况 和 动作 。 从 该 节点 向 外 引出 一 组 弧 ， 
用 于 指出 讲课 的 主体 (Subject) 、 客 体 1 (Recipient， 直 接 宾语 )、 客 体 2 (Object， 间 接 宾 
语 ) 、 开 始 时 间 (Start-time) 、 结 束 时 间 (End-time ) 。 
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时 间 





结 
结束 于 二 月份 是 





图 2-32 带 有 事件 和 情况 节点 的 语义 网 络 


(3) 谓词 逻辑 关系 的 表示 “语义 网 络 还 可 实现 命题 和 谓词 巡 辑 中 关于 “ 合 取 ”“ 析 取 ” 
“否定 ”及 “蕴含 ”等 关系 的 表示 。 
1) 合 取 。 在 语义 网 络 中 ， 合 取 命 题 通过 引入 “与 ”节点 来 表示 。 例 如 :Helen 给 学 生 
讲授 人 工 智 能 和 学 生 学 习 人 工 智能 ， 其 谓词 公式 为 : 
Teach (Helen, Siudent, AI) MLearn (Stiuedent, A7) 
可 以 表示 为 图 2-33 所 示 的 带 有 “与 ”节点 的 语义 网 络 。 
2) 析 取 。 析 取 命 题 通过 引入 “或 ”节点 来 表示 。 例 如 : Pennis 打 和 链球 或 者 John 练 游 
泳 ， 其 谓词 公式 为 : 
Plays (Dennis, basketball) VPlays (John, swimming ) 
可 以 表示 为 图 2-34 所 示 的 带 有 “或 ”节点 的 语义 网 络 。 











Object 


Swimming 


图 2-33 带 有 “与 ”市 点 的 语义 网 络 图 2-34 带 有 “或 ”节点 的 语义 网 络 

















3) 否定 。 在 语义 网 络 中 ， 对 于 类 属 关系 或 包含 关系 ,可 以 直接 采用 ~ 1SA、- AKO、 
”AMO 及 -Part-of 的 有 向 弧 来 标注 。 对 于 更 一 般 的 情况 ， 则 引入 “ 非 ” 节 点 来 表示 。 例 
如 :Helen 给 学 生 讲 授 人 工 智 能 和 学 生 不 学 习 人 工 智能 ， 其 谓词 公式 表示 为 
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Teach (Helen, Siudent, AI) A- Learn 
( Stuedent, Al7) 

可 以 表示 为 如 图 2-35 所 示 的 语义 网 络 。 

4) 缠 含 。 通 过 引入 “蕴含 ”节点 表示 规则 
中 前 提 条 件 4 和 结论 B 之 间 的 因果 关系 ,含义 
为 “如 果 4…， 和 那么 B…”。 蕴 含 节点 引出 两 条 
弧 , 一 条 弧 指 向 命题 中 的 前 提 条 件 ， 记 为 
ANTE, 男 一 条 弧 指 向 该 规则 结论 ， 记 为 
CONSE。 例 如 : 如 果 Helen 周末 缺席 ， 那 么 或 者 
Rose 代替 ， 或 者 Lala 代替 。 

其 语义 网 络 表 示 如 图 2-36 所 示 。 




















妈 2-35 带 有 “ 非 ” 节 点 的 语义 网 络 














Subject 











图 2-36 带 有 “蕴含 ” 





(4) 存在 量词 和 全 称 量词 的 表示 

1) 存在 量词 。 存 在 量词 在 语义 网 络 中 的 表示 方法 相对 简单 ， 可 以 直接 用 ISA、AMO、 
AKO 或 Part-of 等 弧 表 示 ， 例 如 命题 

该 学 生 学 习 了 一 门 程序 设计 语言 

这 是 一 个 含有 存在 量词 的 命题 ， 图 2-37 给 
出 了 相应 的 语义 网 络 表示 。 

在 该 图 中 ， 网 络 中 的 5 节点、 工 节 点 、P 
节点 均 是 一 个 存在 变量 ,分 别 表示 一 个 特定 的 
学 生 、 一 个 特定 的 学 习 事 件 、 一 个 特定 的 程序 图 2-37 具有 存在 量词 的 语义 网 络 
设计 语言 。 而 学 习 事 件 包 括 两 个 部 分 : 主体 
Subject 和 客体 Object。 节 点 S、L 和 P 都 用 ISA 弧 与 概念 节点 Student、Learn 和 Program 相连 ， 
表示 存在 量词 。 

2) 全 称 变量 。 对 于 全 称 变 量 ， 其 语义 网 络 表示 相对 复杂 ， 在 此 引入 G. G. Hendrix 提出 的 网 
络 分 区 技术 。 其 基本 思想 为 : 把 一 个 复杂 的 命题 拆 分 为 若干 个 子 命 题 ， 每 个 子 命题 用 一 个 较 简 单 
的 语义 网 络 表示 ， 称 为 一 个 子 空间 ， 多 个 子 空间 构成 一 个 大 空间 ， 每 个 子 空间 可 以 看 作 大 空间 的 
一 个 节点 ， 称 为 超 节 点 。 空 间 可 以 逐 层 般 套 ， 子 空间 之 间 用 弧 进 行 连接 。 例 如 命题 

每 个 学 生 都 学 习 了 一 门 程序 设计 语言 

图 2-38 给 出 了 相应 的 语义 网 络 表示 。 

在 该 图 中 ，Gs 是 一 个 概念 节点 ， 表 示 具 有 全 称 量化 的 一 般 事 件 ，G 是 一 个 实例 节点 ， 
表示 它 为 Gs 中 的 一 个 具体 实例 。 从 节点 G 引出 的 三 条 弧 中 ， 弧 “ISA” 是 说 明 节 点 、 弧 


(C53) 
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ISA AKO 


ES 醒 汪 





























图 2-38 具有 一 个 全 称 量词 的 语义 网 络 


“FORM” 说 明 它 所 代表 的 子 空间 及 其 具体 形式 、 弧 “VY ”说 明 它 所 代表 的 全 称 量词 ， 并且， 
每 一 个 全 称 量词 都 需要 一 条 这 样 的 狐 ， 对 应 几 个 全 称 变量 ,就 存在 几 条 这 样 的 弧 。 又 如 


每 个 学 生 都 学 习 了 所 有 的 程序 设计 语言 


其 相应 的 语义 网 络 表示 如 图 2-39 所 示 。 
2. 6.4 语义 网 络 表 示 法 的 特点 
AK 
Subject Object 


(1) 结构 性 ”语义 网 络 表 示 法 是 一 种 知 
识 的 显 式 表示 方法 。 这 种 结构 性 还 体现 在 下 
层 概念 节点 可 以 继承 、 补 充 或 变异 上 层 概 念 
的 属性 ， 从 而 实现 信息 的 共享 。 

(2) 自然 性 语义 网 络 是 一 个 带 有 标识 图 2-39 具有 两 个 全 称 量词 的 语义 网 络 
的 有 向 图 ， 便 于 理解 ， 可 以 很 容易 地 实现 自 
然 语言 和 语义 网 络 之 间 的 转换 。 

(3) 非 严 格 性 ”语义 网 络 的 缺点 之 一 就 是 其 没有 公认 的 表示 形式 ， 表 示 形 式 不 具有 严 
格 性 。 同 时 ， 语 义 网 络 表 示 下 的 推理 过 程 会 出 现 “ 错 位 ”现象 ， 不 能 保证 推理 结果 的 正 


确 性 。 


2.7 框架 表示 法 


1975 年 ， 美 国 著 名 AI 学 者 Minsky 提出 了 框架 (Frame) 理论 。 该 理论 认为 人 们 对 现实 
世界 中 各 种 事物 的 认识 都 是 以 一 种 类 似 于 框架 的 结构 存储 在 记忆 中 的 。 例 如 ,一 个 人 未 走 进 
某 火 车 站 候车 厅 之 前 ， 就 能 根据 以 往 关 于 对 “候车 厅 ” 的 印象 ， 想 象 到 这 个 候车 厅 一 定 有 
行李 安检 系统 、 旅 客 候车 椅 、 检 票 口 、 列 车 运行 指示 有 牌 等 。 尽 管 他 对 本 候车 厅 内 行李 安检 系 
统 的 具体 方位 、 旅 客 候车 椅 的 具体 数量 、 检 票 口 的 大 小 、 列 车 运行 指示 牌 的 甚 挂 位 置 等 还 不 
很 清楚 ， 但 对 候车 厅 的 基本 结构 是 可 以 预见 到 的 ， 这 是 因为 他 通过 以 往 看 过 的 候车 厅 ， 已 经 
在 记忆 中 建立 了 关于 候车 厅 的 框架 。 

当面 临 一 个 新 事物 时 ， 就 从 记忆 中 找 出 一 个 合适 的 框架 ， 并 根据 实际 情况 对 其 细节 加 以 
修改 、 补 充 ， 从 而 形成 对 事物 的 认识 。 本 例 中 ， 当 他 进入 了 这 个 候车 厅 ， 就 可 以 获知 上 述 未 
知情 况 的 细节 ， 将 它们 添加 到 候车 厅 框 架 中 ， 就 得 到 了 候车 厅 框 架 的 一 个 具体 事例 。 

1. 框架 的 构成 

框架 是 一 种 描述 所 论 对 象 (一 个 事物 、 事 件 或 概念 ) 属性 的 数据 结构 。 

一 个 框架 由 框架 名 、 构 (Slot)、 侧 面 (Faced) 和 值 4 部 分 组 成 。 框 架 名 用 以 指定 某 个 
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概念 、 对 象 或 事件 ， 其 下 层 由 若干 个 “ 酸 ” 
槽 和 侧面 所 具有 的 属性 值 分 别称 为 槽 值 和 侧面 值 。 
一 个 框架 的 一 般 形 式 为 : 
< 框架 名 > 
< 槽 名 1> < 侧面 名 11> < 值 111> … 

< 侧面 名 12> < 值 121> … 













































































< 槽 名 2>< 侧 面 名 21> < 值 211> … 
< 侧面 名 22> < 值 221> … 




















< 槽 名 n> < 侧面 名 nl1> < 值 z11> … 


2. 知识 表示 举例 
【 例 2-23】 
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组 成 ， 














每 个 “ 槽 ”又 可 划分 为 知 干 个 “侧面 。 





若 要 描述 某 高 校 “ 人 工 智能 课程 ”这 一 概念 ， 可 以 考察 其 具有 的 几 个 属 


性 ， 如 课程 类 别 、 课 程 性 质 〈 学 分 、 学 时 、 开 课 学 期 、 考 核 方式 ) 、 授 课 方式 、 授 课 教 师 


(姓名 、 性 别 、 年 龄 、 


内 称 、 部 门 、 人 研究 方向 ) 、 授 课 对 象 年级、 人数 、 专 业 ) 等 。 其 中 ， 


“课程 类 别 ”“ 课 程 性 质 ”“ 授 课 方 式 ”“ 授 课 教 师 ” 和 “授课 对 象 ” 为 “人 工 智能 课程 ” 




















的 模 ， 而 “课程 类 别 ” 和 “授课 方式 ”没有 侧面 ， 


“课程 性 质 ” 有 4 个 侧面 , “授课 教师 ” 

















有 6 个 侧面 ,“ 授 课 对 象 ” 有 3 个 侧面 ， 如 果 给 各 个 模 和 侧面 赋 以 具体 的 值 ， 就 得 到 “人 工 


智能 课程 ”这 一 概念 的 一 个 实例 框架 。 
框架 和 名， < 人 工 智能 课程 > 
课程 类 别 : 学 位 课 
课程 性 质 ， 学 分 : 2 
学 时 ;40 
开课 学 期 第 1 学 期 后 十 周 
考核 方式 ,闭卷 笔试 














授课 方式 : 多 媒体 、 板 书 相 结合 
授课 教师 : 姓名: Linda 

性 别 : 女 

年 龄 : 30 

职称 : 副教授 

部 门 : 自动 化 学 院 

研究 方向 : 智能 控制 与 人 工 智能 
授课 对 象 : 年 级 : 一 年 级 研究 生 

人 数 : 85 

专业 : 控制 理论 与 控制 工程 

【 例 2-24】 某 款 “LOREAL 隔离 露 ”产品 框架 


框架 名 : < LOREAL 隔离 露 > 
商标 : LOREAL 
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商品 名 称 : LOREAL 多 重 防护 隔离 露 
商品 情况 : 制造 商 : 苏州 尚美 国际 化 妆 品 有 限 公司 
产地 : 江苏 
限期 使 用 日 期 2012 年 11 月 16 日 
净 含 量 : 30ml 
颜色 : 紫色 
适用 人 和 群 : 偏 黄 暗 沉 肤色 
SPF 指数 : 30+ 
作用 : 抵御 UV 紫外 线 和 污染 
在 这 个 框架 中 ,“< >” 中 是 框架 名 ， 有 3 个 梭 ， 权 名 分 别 是 “商标 ” “商品 名 称 ” 和 
“商品 情况 ”。 其 中 ，“ 商 品 情况 ” 槽 又 包含 8 个 侧面 ， 侧 面 名 分 别 是 “制造 商 ”“ 产 地 ” 
“限期 使 用 日 期 ”“ 净 含量 ” “颜色 ”“ 适 用 人 群 ”“SPF 指数 ”和 “作用 ”， 每 个 侧面 又 有 
各 自 的 值 。 
3. 框架 系统 
框架 也 可 以 发 展 成 框架 系统 ， 以 表示 更 
复杂 、 更 广泛 的 事件 。 图 2-40 为 自然 灾害 系 
统 的 框架 系统 结构 ， 其 中 ,自然 灾害 、 山 
洪 、 台 风 和 地 震 都 可 以 用 框架 表示 ， 用 框架 
联系 ISA 将 它们 联系 起 来 ， 形 成 了 一 个 框架 
系统 。 

























































































4. 框架 表示 法 的 特点 

(1) 结构 性 ”框架 表示 法 的 突出 特点 在 | 
于 表达 结构 性 的 知识 ， 能 够 把 知识 的 内 部 结 | 一 - 
构 关系 及 知识 间 的 联系 表示 出 来 ， 是 一 种 结 图 2-40 自然 灾害 的 框架 系统 


构 化 的 知识 表示 方法 。 

(2) 继承 性 ”框架 表示 法 通过 将 槽 值 设置 为 男 一 个 框架 的 名 字 而 实现 框架 间 的 联系 ， 
建立 其 复杂 的 框架 网 络 。 其 中 ， 下 层 框 架 可 以 继承 上 层 框 架 的 槽 值 ， 也 可 以 补充 和 修改 ， 从 
而 减少 了 知识 的 宛 余 ， 并 且 很 好 地 保证 了 知识 的 一 致 性 。 

(3) 目 然 性 ”框架 表示 法 与 人 们 在 观察 事物 时 的 思维 活动 相 一 致 。 


2.8 状态 空间 表示 法 






































现实 世界 中 的 问题 求解 过 程 实际 上 可 以 看 成 是 一 个 搜索 或 者 推理 的 过 程 。 为 了 能 够 有 效 
地 求解 问题 ， 就 要 以 适当 的 形式 对 所 求解 的 问题 进行 表示 。 不 同 的 表示 方法 对 同一 问题 的 求 
解 会 产生 不 同 的 搜索 效率 。 状 态 空间 表示 法 是 一 种 最 基本 的 问题 表示 及 搜索 过 程 形式 化 方 
法 ， 是 讨论 问题 求解 技术 的 基础 。 

(1) 状态 ”状态 是 描述 问题 求解 过 程 中 不 同时 刻 状况 的 数据 结构 ， 一 般 用 一 组 变量 的 
有 序 集合 表示 : Q= (go，91，…，9,)，i=0，1，…, n， 其 中 9 为 状态 变量 。 当 每 个 状态 变 
量 得 到 一 个 确定 值 时 ， 就 确定 了 一 个 具体 的 状态 。 
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(2) 算 符 ”能 够 引起 某 些 状态 变量 发 生变 化 ， 从 而 使 问题 由 一 个 状态 变 为 男 一 个 状态 
的 操作 称 为 算 符 。 

(3) 状态 空间 ”由 表示 一 个 问题 的 全 部 状态 及 一 切 可 用 算 符 构 成 的 集合 称 为 该 问题 的 
状态 空间 。 它 一 般 由 三 部 分 构成 : 问题 的 所 有 可 能 状态 集合 S$， 所 有 算 符 集合 目标 状态 
D。 用 一 个 三 元 组 表示 为 (S$，F，D)。 状 态 空间 的 图 示 形 式 称 为 状态 空间 图 ， 其 中 节点 表 
示 状 态 ; 有 辣 边 ( 弧 ) 表示 算 符 。 

(4) 问题 的 解 ” 从 问题 的 初始 状态 56 出 发 ， 经 过 一 系列 的 算 符 运 算 ， 到达 目 标 状 态 D， 
由 初始 状态 到 目标 状态 所 有 算 符 的 序列 就 构成 了 问题 的 一 个 解 。 

用 状态 空间 法 表示 问题 的 步骤 如 下 : 

Step1: 定义 状态 的 描述 形式 0Q=(go, gi,…, gq,), i=0, 1,，…, no 

Step2: 把 问题 的 所 有 可 能 状态 用 所 定义 的 状态 描述 形式 都 表示 出 来 ， 并 确定 问题 的 初 
始 状 态 描述 So 和 目标 状态 描述 D。 

Step3: 定义 一 组 算 符 利用 这 组 算 符 可 把 问题 由 一 个 状态 转变 为 男 一 个 状态 。 

问题 的 求解 过 程 是 一 个 不 断 把 算 符 作用 于 状态 的 过 程 。 首 先 将 使 用 的 算 符 作用 于 初始 状 
态 5 和， 以 产生 新 的 状态 $; ， 然 后 再 把 适用 的 算 符 作用 于 新 的 状态 ， 这 样 继续 下 去 ， 直 到 产 
生 目 标 状态 九 为 止 。 从 初始 状态 到 目标 状态 所 有 算 符 构成 的 序列 就 是 所 得 到 的 问题 的 一 个 
解 。 在 所 有 的 解 中 ， 通 常 将 适用 算 符 最 少 的 解 称 为 最 优 解 。 

状态 空间 法 求解 问题 的 具体 实例 可 参看 第 3 章 中 的 数码 问题 的 求解 。 


2.9 与 或 图 表示 法 


与 或 图 是 一 种 超 图 ， 通 常 表 达 为 树 的 形式 ， 也 称 为 与 或 树 ， 它 是 一 种 系统 地 将 问题 分 解 
为 互相 独立 的 小 问题 ， 然 后 分 而 解决 的 方法 。 

与 或 图 中 有 两 种 代表 性 的 节点 : “与 节点 ”和 “或 节点 ”。“ 与 节点 ” 指 所 有 的 后 续 节 
点 都 有 解 时 它 才 有 解 ;“ 或 节点 ” 指 各 个 后 续 节 点 均 完全 独立 ， 只 要 其 中 有 一 个 有 解 它 就 
有 解 。 

与 或 图 是 人 们 在 求解 问题 时 两 种 思维 方法 的 直接 表现 。 与 树 是 对 求解 问题 的 分 解 ， 即 将 

复杂 的 大 问题 分 解 为 一 组 简单 的 小 问题 ， 或 将 总 问题 分 解 为 若干 子 问题 ， 如 果 所 有 子 问题 都 
得 到 解决 ， 则 总 问题 也 就 得 到 解决 了 。 同 样 ， 子 问题 又 可 继续 分 解 为 更 小 的 子 问题 ， 由 此 即 
人 

或 树 是 将 较 难 的 问题 变换 为 若干 较 简单 的 等 价 或 等 效 问题 。 若 其 中 任何 一 个 转换 的 问题 
得 到 求解 ， 则 原来 较 难 的 问题 也 就 得 到 求解 。 同 样 ， 较 简单 的 问题 还 可 继续 进一步 再 等 价 变 
换 为 若干 更 容易 的 问题 ， 由 此 即 可 形成 问题 变换 的 或 树 图 ， 如 图 2-42 所 示 。 







































































原始 问题 ( 难 ) 原始 问题 ( 难 ) 
子 问题 (简单 ) 等 价 问题 (容易 ) 
子 子 问题 (更 简单 ) 等 价 问题 (更 易 ) 
图 2-41 与 树 问 题 分 解 图 图 2-42 或 树 问题 变换 图 
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对 于 实际 问题 求解 过 程 中 ， 往 往 需要 兼用 分 解 和 变换 两 种 方法 ， 即 采用 与 树 和 或 树 相 结 
合 的 图 一 与 或 图 表示 法 。 与 或 图 表示 法 求解 问题 的 具体 实例 可 参看 第 3 章 中 的 数码 问题 的 
求解 。 








习题 





什么 是 知识 ?知识 表示 的 方法 有 哪些 ? 
什么 是 命题 ? 什么 是 原子 命题 ? 什么 是 复合 命题 ? 


. 谓词 的 一 般 形式 是 怎样 的 ? 

产生 式 系 统 的 基本 组 成 包括 哪些 部 分 ? 
产生 式 系统 的 推理 方式 有 哪儿 种 ? 

. 简 述 语义 网 络 表示 法 的 特点 。 

. 简 述 框架 表示 法 的 特点 。 





wm 
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第 3 章 
图 搜索 技术 


图 搜索 技术 是 人 工 智 能 的 基本 研究 内 容 之 一 ， 很 多 实际 问题 的 解决 都 可 以 转化 为 图 搜索 问 
题 。 根 据 实 际 问题 性 质 的 不 同 ， 图 搜索 又 可 以 分 为 状态 图 搜索 、 与 或 图 搜索 以 及 博弈 图 搜索 等 。 


3.1 问题 的 提出 




















我 们 通过 以 下 几 个 例子 引入 图 搜索 的 概念 。 

【 例 3-1】 如 图 3-1 所 示 的 由 3x3 的 方 格 组 成 的 棋盘 ， 分 别 放 和 人 1~8 的 数码 ， 剩 下 的 一 
个 格子 为 空 。 如 果 某 个 数码 相 邻 的 格子 为 空 ， 则 可 以 将 该 数码 移 人 空格 所 在 的 位 置 。 对 于 给 
定 的 如 图 3-1 所 示 的 初始 排放 顺序 ， 寻 找 一 个 数码 的 移动 序列 ， 使 得 最 终 的 排放 顺序 如 
图 3-2 所 示 。 该 问题 被 称 为 八 数码 问题 或 重 排 九 宣 问题 。 





















































2|8|3 1|12|3 
1|6|4 8 4 
7 5 7|6|5 

图 3-1 初始 排放 顺序 图 3-2 ”目标 排放 顺序 


对 于 该 问题 的 所 有 可 能 的 排放 顺序 有 很 多 ， 把 每 种 排放 顺序 称 为 该 问题 的 一 个 节点 ， 如 
果 某 个 节点 4 可 以 通过 一 次 数码 的 移动 形成 男 外 一 个 节点 了， 则 画 上 一 条 由 4 指向 中 的 有 向 
边 。 所 有 这 样 的 节点 和 有 向 边 ， 就 构成 了 一 个 有 向 图 ， 把 该 有 向 图 称 为 该 问题 所 对 应 的 状态 
空间 图 。 本 例 问题 的 解决 可 以 转化 为 在 状态 空间 图 中 寻找 一 条 从 初始 排放 顺序 对 应 的 节点 到 
目标 排放 顺序 所 对 应 的 节点 的 路 径 问 题 。 这 就 是 我 们 在 本 章 中 将 要 介绍 的 状态 图 搜索 问题 。 
【 例 3-2】 有 如 图 3-3 所 示 的 两 个 四 边 形 4BCD 和 4'B'C'D'， 要 求证 明 他 们 全 等 。 





B' 
B 


D CC D! (GY 
图 3-3 ”两 个 四 边 形 
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我 们 将 本 例 问 题 设 为 0。 为 解决 该 问题 ,分 别 在 两 个 图 形 中 做 辅助 线 B、D 和 B'、D'， 
如 果 能 证 明 问 题 0 ， 人 4BD 关 人 4'B'D'， 并且 能 证 明 问 题 0;: 和 人 BCD 兰 信 B'C'D'， 则 问题 0 
得 到 证 明 。 

进一步 ,为 了 证 明 01 成 立 ， 只 需要 证 明 0 、Q1，、Q13 同 时 成 立 或 者 011 、Qi 、043 同 
时 成 立 。 其 中 : 

On: 证 明 4B= 4’B” 0Qy%: 证 明 4D= 4D 0w3: 证 明 L4= 人 4 

0 路 :证明 4B= 4A’B'” 01,: 证 明 A4D= A'D' 0'3: 证 明 BD= B'D' 

而 为 了 证 明 0, 成 立 ， 只 需要 证 明 0,, 、0， 、02 同时 成 立 或 者 0 和 、@2 、0@2 同时 成 立 。 
其 中 

0 : 证 明 BC= B'C'” 0Q»: 证 明 CD=C'D' 0Qw: 证 明 ZC= ZC 





0 和 11: 证 明 BC= B'C'” 0%: 证明 CD=C'D' 05: 证 明 BD= B'D' 
上 述 思路 可 用 图 3-4 来 表示 : 





O11 2 O13 Ql QO1; O13 2 22> 223 O21 2 223 





图 3-4 例 3-2 问题 所 对 应 的 与 或 图 


图 中 的 弧 线 表示 所 连 边 为 “与 ”关系 ,不 带 弧 线 的 边 为 “或 ”关系 。 这 个 图 中 既 有 
“与 ”关系 又 有 或 关系 ， 因 此 被 称 为 与 或 图 。 但 这 个 与 或 图 是 一 种 特殊 的 与 或 图 ， 称 为 与 
或 树 。 

图 3-5 是 图 3-4 的 一 个 子 图 。 我 们 假设 能 够 证 明 此 图 中 0 、0m 、05 、0 、0， 、023 
都 成 立 ， 则 根据 前 面 的 分 析 ， 可 知 Oo 、Q; 都 成 立 ， 即 0 成 立 。 我 们 把 图 3-5 称 为 图 3-4 的 
一 个 解 图 。 因 此 可 以 将 最 初 的 问题 转化 为 在 图 3-4 中 寻找 解 图 的 问题 ， 这 就 是 本 章 将 要 介绍 
的 与 或 图 搜索 问题 。 








0 


9 0, 


O11 2 O13 01 2 223 


图 3-5 例 3-2 问题 所 对 应 的 与 或 图 的 一 个 解 图 
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【 例 3-3】 有 一 堆 钱币 〈 不 考虑 面值 ) ， 二 人 轮流 对 其 进行 分 堆 ， 要 求 任 一 选手 每 次 都 
把 其 中 的 一 堆 分 成 数目 不 等 的 两 堆 ， 直 至 某 一 选手 不 能 再 按 要 求 分 堆 则 认输 。 该 游戏 被 称 为 
Grundy 博弈 (或 分 钱币 游戏 ) 。 

本 例假 设 共 有 7 枚 钱币 ， 并 且 对 方 先 走 ， 所 有 可 能 的 走 步 过程 可 以 用 图 3-6 表示 。 



































9 (4,1,1,1,1) 





4 G,LLD 网 B 对 手 走 








b ,LLD) 





图 3-6 7 枚 钱币 对 手 先 走时 所 有 可 能 的 走 步 

















我 们 可 以 将 上 图 称 为 该 问题 所 对 应 的 博弈 图 。 可 见 ， 假 设 无 论 对 手 如 何 走 步 ， 如 果 我 方 
都 能 将 棋局 走向 妃 ， 则 我 方 必 胜 ， 因 此 这 相当 于 在 上 图 中 寻找 从 初始 节点 到 节点 如 的 解 图 的 
问题 。 但 是 实际 问题 的 复杂 性 使 得 我 们 无 法 得 到 完整 的 博弈 图 ， 比 如 西洋 跳棋 完整 的 博弈 树 
约 有 10 “个 节点 ， 这 是 一 个 十 分 庞大 的 博弈 图 ， 利 用 现 有 的 计算 机 难以 处 理 ， 因 此 试图 利用 
完整 的 博弈 树 来 进行 极 小 极 大 分 析 是 困难 的 。 实 际 上 ， 我 们 只 能 随 痢 博弈 的 进行 画 出 部 分 博 
弈 图 ， 本 章 博 弈 图 搜索 部 分 将 对 博弈 图 搜索 进行 较为 深入 的 介绍 。 


3.2 状态 图 搜索 


状态 空间 图 (状态 图 ) 是 为 解决 实际 问题 而 抽象 出 的 一 种 有 向 图 ， 这 种 有 向 图 由 节点 
和 有 向 边 组 成 ， 其 中 节点 表示 问题 的 某 种 格局 或 状态 ， 边 表示 两 节点 之 间 的 某 种 联系 ， 这 种 
联系 可 以 是 某 种 操作 、 规 则 、 变 换 、 算 子 、 通 道 或 关系 等 。 而 问题 求解 则 可 转化 为 在 状态 图 
中 寻找 目标 节点 或 寻找 从 初始 节点 到 目标 节点 的 一 条 解 路 径 的 问题 ， 因 此 ， 研 究 状 态 图 搜索 
具有 普遍 意义 。 


3. 2. 1 状态 图 搜索 分 类 


状态 图 的 搜索 就 是 在 状态 图 中 寻找 目标 节点 或 路 径 的 基本 方法 。 即 从 初始 节点 出 发 ， 按 
照 某 种 规则 寻找 目标 节点 的 过 程 〈 也 可 以 反 向 进行 ) 。 

如 果 在 寻找 目标 节点 的 过 程 中 我 们 记录 下 所 经 过 的 路 线 ， 则 目标 节点 找到 后 ， 路 径 也 就 
找到 了 。 所 以 寻找 目标 和 寻找 路 径 其 实 是 一 致 的 。 

状态 图 搜索 有 两 种 最 基本 的 搜索 方式 : 树 式 搜索 和 线 式 搜索 。 
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所 谓 树 式 搜索 ， 就 是 以 “ 画 树 ”的 方式 进行 搜索 ， 即 对 每 个 被 考察 的 节点 ， 同 时 记录 
下 与 其 相 邻 的 所 有 其 他 节点 。 因 此 ， 树 式 搜索 所 记录 的 轨迹 是 一 棵 “ 树 ”， 这 棵 树 就 称 为 搜 
索 树 。 

所 谓 线 式 搜索 ， 就 是 以 “ 画 线 ”的 方式 进行 搜索 。 只 记录 与 其 相 邻 的 节点 中 的 一 个 。 
因此 ， 线 式 搜 索 所 记录 的 轨迹 是 一 条 “ 线 ”。 

对 于 线 式 搜索 ， 只 要 搜索 成 功 ， 则 “搜索 线 ” 就 是 所 找 的 路 径 ， 即 问题 的 解 ， 而 树 式 
搜索 成 功 后 ， 还 需 再 从 搜索 树 中 找 出 所 求 路 径 。 

本 书 以 树 式 搜索 为 例 对 状态 图 搜索 进行 介绍 。 

对 于 树 式 搜索 我 们 可 以 在 扩展 节点 时 记 住 节 点 间 的 父子 关系 ， 这 样 ， 当 搜索 成 功 时 ， 即 
可 从 目标 节点 通过 这 种 父子 关系 一 直 回 溯 到 初始 节点 ， 便 得 到 一 条 从 初始 节点 到 目标 节点 的 
路 径 ， 即 问题 的 一 个 解 。 

为 了 提高 搜索 效率 (尽快 地 找到 目标 节点 ) 或 者 寻找 最 佳 路 径 (最 佳 解 )， 有 必要 研究 
搜索 策略 。 对 于 状态 图 搜索 ,已 经 提出 了 许多 策略 ， 它 们 大 体 可 分 盲目 搜索 和 启发 式 搜索 两 
大 类 。 盲 目 搜 索 就 是 无 向 导 的 搜索 。 启 发 式 搜索 就 是 有 向 导 的 搜索 ， 是 利用 启发 性 信息 引导 
的 搜索 。 所 谓 启 发 性 信息 就 是 与 问题 有 关 的 有 利于 尽快 找到 问题 解 的 信息 或 知识 。 

如 前 所 述 ， 当 找到 目标 节点 后 ， 为 了 得 到 从 初始 节点 到 目标 节点 的 路 径 ， 需 要 在 搜索 过 
程 中 随时 记录 已 经 考查 过 的 节点 的 父 节 点 。 为 此 ， 我 们 使 用 CLOSED 表 来 专门 记录 考查 过 的 
节点 ，CLOSED 表 结 构 如 表 3-1 所 示 。 

另外 ， 对 于 树 式 搜索 来 说 ， 还 需要 不 断 地 把 待考 查 的 候选 节点 组 织 在 一 起 ， 并 做 某 种 排 
列 ， 以 便 控制 搜索 的 方向 和 顺序 。 为 此 ， 我 们 采用 一 个 称 为 OPEN 表 的 动态 数据 结构 ， 来 专 
门 登记 当前 待考 查 的 候选 节点 ，OPEN 表 的 表 结 构 如 表 3-2 所 示 。 

表 3-1 CLOSED 表 表 3-2 OPEN 表 


编号 节点 父 节点 编号 节点 父 节点 编号 


















































下 面 给 出 树 式 搜索 的 一 般 算法 。 

Stepl ”把 初始 节点 S60 放 入 0PEN 表 中 ; 

Step2 若 OPEN 表 为 空 ， 则 搜索 失败 ， 退 出 ; 

Step3 ”移出 OPEN 表 中 第 一 个 节点 W 放 和 CLOSED 表 中 ， 并 冠 以 顺序 编号 n; 

Step4 若 V 是 目标 节点 ， 则 搜索 成 功 ， 结 

Step5 若 V 不 可 扩展 ， 则 转 Step2 ; 

Step6 ”扩展 N， 生 成 一 组 子 节点 ， 对 这 组 子 节点 作 如 下 处 理 : 

1) 如 果菜 节点 是 NN 的 先辈 节点 ， 则 删除 ; 

2) 对 已 存在 于 OPEN 表 的 节点 (如 果 有 的 话 ) 也 删除 ; 但 删除 之 前 要 比较 其 返回 初始 
节点 的 新 路 径 与 原 路 径 ， 如 果 新 路 径 “ 短 ”， 则 修改 这 些 节点 在 OPEN 表 中 的 原 返 回 指针 ， 
使 其 沿 新 路 返回 ; 

3) 对 已 存在 于 CLOSED 表 的 节点 (如 果 有 的 话 ) ， 作 与 2) 同样 的 处 理 ， 并 且 再 将 其 移 
出 CLOSED 表 ， 放 入 OPEN 表 重 新 扩展 ; 
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4) 对 其 余子 节点 配 上 指向 w 的 返回 指针 后 放 入 OPEN 表 中 某 处 ， 或 对 OPEN 表 进 行 重 
新 排序 ， 转 Step2。 

算法 中 提 到 的 扩展 ， 是 指 生成 与 当前 节点 相 邻 的 节点 过 程 ， 所 生成 的 一 组 节点 称 为 当前 
节点 的 子 节点 ， 而 当前 节点 称 为 这 一 组 子 节 点 的 父 节 点 。 


3. 2.2 穷 举 式 搜索 


穷 举 式 搜索 属于 盲目 搜索 ， 不 需要 与 问题 有 关 的 启发 信息 ， 主 要 包括 广度 优先 搜索 算法 
和 深度 优先 搜索 算法 等 。 
1. 广度 优先 搜索 算法 
广度 优先 搜索 算法 也 叫 宽度 优先 或 横向 优先 算法 ， 其 基本 思想 是 先 在 同一 级 节点 中 考 
， 只 有 当 同 一 级 节点 考查 完 之 后 ， 才 考查 下 一 级 节点 。 步 又 如 下 : 
Stepl ”把 初始 节点 S60 放 入 OPEN 表 中 ; 
Step2 若 OPEN 表 为 空 ， 则 搜索 失败 ， 退 出 ; 
Step3 取 OPEN 表 中 前 面 第 一 个 节点 W 放 在 CLOSED 表 中 ， 并 冠 以 顺序 编号 n; 
Step4 若 入 为 目标 节点 ， 则 搜索 成 功 ， 结 
Step5 若 V 不 可 扩展 ， 则 转 Step2 ; 
Step6 扩展 W， 将 其 所 有 未 在 OPEN 及 CLOSED 表 中 出 现 过 的 子 节点 针 依 次 放 和 人 OPEN 
表 尾 部 ， 转 Step2。 
可 以 看 出 ， 在 广度 优先 搜索 算法 中 ，OPEN 表 的 结构 是 一 个 先进 先 出 的 队列 ，CLOSED 
表 是 一 个 顺序 表 。CLOSED 表 中 各 节点 按 顺 序 编号 ， 正 被 考查 的 节点 在 CLOSED 表 中 编号 最 
大 。 如 果 问 题 有 解 ，OPEN 表 中 必 出 现 目 标 节点 Sg， 那 么 ， 当 搜索 到 目标 节点 Sg 时 ， 算 法 
结束 ， 然 后 在 CLOSED 表 中 按照 父子 关系 往 回 追溯 ， 直 至 初始 节点 ， 所 得 的 路 径 即 为 问题 
的 解 。 
广度 优先 搜索 亦 称 为 宽度 优先 或 横向 搜索 。 这 种 策略 是 完备 的 ， 即 如 果 问 题 的 解 存在 ， 
使 用 该 搜索 方法 一 定 能 找到 解 ， 且 找到 的 解 还 是 最 优 解 〈 即 最 短 的 路 径 ) 。 但 该 方法 由 于 缺 
少 启发 式 信息 ， 因 此 搜索 效率 低 。 
【 例 3-4】 用 广度 优先 算法 ,求解 八 数码 问题 。 


2 3 123 
初始 状态 : Sol1 8 4| 目标 : S。8 4 
765 765 


解 : 为 了 简化 规则 ， 我 们 可 以 换 一 种 思路 ， 即 把 数码 的 移动 看 成 空格 的 移动 ， 这 样 ， 移 
动 规则 只 有 四 条 : RI: 空格 左 移 ，R,: 空格 上 移 ，R;: 空格 右 移 ，Rs: 空格 下 移 。 不 妨 约 
定 规则 使 用 顺序 依次 为 RI、R,、R3 、Rs。 

第 一 轮 循环 ， 将 初始 节点 S0 放 入 0PEN 表 中 ， 此 时 OPEN 表 只 有 节点 S。( 如 表 3-3 所 
示 )。 将 So 移出 OPEN 表 放 入 CLOSED 表 ， 并 冠 以 顺序 编号 1 (如 表 3-4 所 示 ) 。So 不 是 目标 
节点 且 可 扩展 ， 因 此 扩展 $,,， 生 成子 节 点 如、C、D， 并 依次 放 入 OPEN 表 尾 部 (如 表 3-5 
所 示 ) 。 

第 二 轮 循 环 : 此 时 OPEN 表 中 依次 为 B、C、D 节点 , 将 B 移 出 OPEN 表 放 入 CLOSED 
表 ， 并 冠 以 顺序 编号 2 (如 表 3-6 所 示 ) ， 妃 不 是 目标 节点 且 可 扩展 ， 因 此 扩展 巨 ， 生 成 子 节 





只 
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点 下 ,并 放 入 OPEN 表 尾 部 ， 此 时 OPEN 表 如 表 3-7 所 示 。 



































表 3-3 只 有 初始 节点 的 表 3-4 第 一 轮 循环 后 的 表 3-5 扩展 初始 节点 后 的 OPEN 表 
OPEN CLOSED 
本 家 节点 父 节点 编号 
节点 父 节点 编号 编号 | 节点 | 父 节点 编号 B 1 
So Nil 1 So Nil C y 
D 1 
表 3-6 第 二 轮 循环 后 的 CLOSED 表 表 3-7 扩展 节点 B 后 的 OPEN 表 
编号 | 节点 父 节点 编号 节点 父 节点 编号 
1 So Ni CE 
D 1 
2 B 1 EF 2 











第 三 轮 循 环 : 此 时 0PEN 表 中 依次 为 C、D、E 市 点 ,将 C 移 出 OPEN 表 放 入 CLOSED 
表 ， 并 和 冠 以 顺序 编号 3，C 不 是 目标 节点 且 可 扩展 ， 因 此 扩展 C， 生 成 子 节点 并 放 入 
OPEN 表 尾 部 。 

直到 第 十 轮 循环 时 ， 发 现 节 点 了 是 目标 节点 ， 此 时 算法 结 
3-7 所 示 。 解 路 径 如 图 3-7 中 粗 线 所 示 。 





。 该 算法 产生 的 搜索 树 如 图 














人， 
"|184 
于 和 
左 
各 下 
B 入 33 及 之 时 3 
184 184 1 4 
了 | 765 
下 下 左 雁 下 
E 123 F | G 生 晤 好 天 283 I 283 
84 18 14 14 164 
765 765 765 765 7 5 
右 下 左 下 上 上 下 左 右 
123 1 这 3 乏 33 乾 要 号 可 283 283 283 283 
8 4 784 1 8 工本 及 284 714 143 145 164 1654 
765 765 |756 765 765 |756 75 ||75 
这 L a R Ss 


2. 深度 优先 搜索 








图 3-7 广度 优先 算法 搜索 树 





每 一 层 始 终 先 只 扩展 一 个 子 节 点 , 不断 地 向 纵深 前 进 ， 直 到 不 能 再 前 进 


(到 达 叶 子 节 点 或 受到 深度 限制 ) 时 ， 才 从 当前 节点 返回 到 上 一 级 节点 ， 沿 男 一 方向 又 继续 


基本 思想 : 
深度 优先 搜索 算法 : 
Stepl 
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Step2 
Step3 
Step4 
Step5 
Step6 


若 OPEN 表 为 空 ， 则 搜索 失败 ， 退 出 ; 

取 OPEN 表 中 前 面 第 一 个 节点 W 放 在 CLOSED 表 中 ， 并 冠 以 顺序 编号 n; 
若是 目标 节点 Sg， 则 搜索 成 功 ， 结 

若 V 不 可 扩展 ， 则 转 Step2; 

扩展 N, 将 其 所 有 未 在 OPEN 及 CLOSED 表 中 出 现 过 的 子 节 点 配 上 指向 NN 的 返 


回 指针 依次 放 入 OPEN 表 的 首部 ， 转 Step2。 

可 以 看 出 ， 这 里 的 OPEN 表 为 一 个 堆栈 。 这 是 与 广度 优先 算法 的 唯一 区 别 。 

此 算法 在 执行 过 程 中 会 产生 回 滴 ， 对 有 限 的 问题 空间 一 定 能 找到 解 ， 但 不 一 定 最 优 ， 所 
以 此 策略 是 不 完备 的 。 

【 例 3-5】 对 于 八 数码 问题 ， 应 用 深度 优先 搜索 策略 ， 可 得 如 图 3-8 所 示 的 部 分 搜索 树 
(由 于 篇 幅 限 制 ， 这 里 未 给 出 完整 的 搜索 树 ) 。OPEN 表 及 CLOSED 表 的 变化 过 程 从 略 。 












































下 
283 283 283 
14 14 164 
763 了 各 入 和 怠 

57 

283 283 

164 164 

3 75 

















图 3-8 ”深度 优先 算法 搜索 树 (部 分 ) 


3. 有 界 深度 优先 搜索 

广度 优先 和 深度 优先 是 两 种 最 基本 的 穷 举 搜索 方法 ， 在 此 基础 上 ， 根 据 需 要 青 加 上 一 害 
的 限制 条 件 ， 便 可 派生 其 他 的 一 些 搜索 方法 ， 如 有 界 深度 优先 搜索 。 

有 界 深度 优先 搜索 就 是 给 出 了 搜索 树 深度 限制 ， 当 从 初始 节点 出 发 沿 某 一 分 枝 扩 展 到 一 




















限定 深度 时 ， 就 不 能 再 继续 向 下 扩展 ， 而 只 能 改变 方向 继续 搜索 。 节 点 x 的 深度 (即位 于 搜 
索 树 的 层 数 ) 通常 用 d(x) 表示 ， 则 有 界 深度 优先 搜索 算法 如 下 : 


Stepl 
Step2 
Step3 
Step4 
Step5 
Step6 


把 S60 放 入 OPEN 表 中 ， 置 $0 的 深度 d(So)= 0; 

若 OPEN 表 为 空 ， 则 搜索 失败 ， 退 出 ; 

取 OPEN 表 中 前 面 第 一 个 节点 N， 放 在 CLOSED 表 中 ， 并 冠 以 顺序 编号 n; 

若 w 是 目标 节点 ， 则 搜索 成 功 ， 结 

若 V 的 深度 d(N)= dm (深度 限制 值 ), 或 入 无 子 节点 ， 则 转 Step2; 

扩展 W， 将 其 所 有 子 节点 Ni 配 上 指向 NN 的 返回 指针 后 依次 放 入 0PEN 表 中 前 
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部 , 置 d(N,)= qd(N)+1， 转 Step2。 
3.2.3 启发 式 搜 索 


广度 优先 和 深度 优先 都 属于 穷 举 搜索 法 ， 从 理论 上 讲 ， 似 乎 可 以 解决 任何 状态 空间 的 搜 
索 问 题 ， 但 实践 表明 ， 穷 举 搜索 只 能 解决 一 些 状 态 空 间 较 小 的 简单 问题 ， 而 对 于 那些 大 状态 
空间 问题 ， 穷 举 搜索 就 不 能 胜任 了 。 因 为 大 空间 问题 ， 往 往 会 导致 “组 合 爆 炸 ”。 人 们 不 得 
不 寻找 更 有 效 的 搜索 方法 ， 即 启发 式 搜索 策略 。 

启发 式 搜索 就 是 利用 启发 性 信息 进行 引导 的 搜索 。 局 发 性 信息 就 是 有 利于 尽快 找到 问题 
WE 
好 的 节点 ， 然 后 对 其 扩展 ， 这 样 可 以 大 大 减少 无 谓 的 搜索 ， 提 高 搜索 效率 。 

在 启发 式 搜 索 中 ， 通 常用 启发 函数 来 表示 启发 性 信息 。 

启发 函数 是 用 来 估计 搜索 树 上 节点 x 与 目标 节点 Sg 接近 程度 的 一 种 函数 ， 通 常 记 
为 h(x)。 

定义 启发 函数 可 以 参考 的 思路 有 : 一 个 节点 到 目标 节点 的 某 种 距离 或 差异 的 度量 ; 一 个 
节点 处 在 最 佳 路 径 上 的 概率 ; 或 者 根据 经 验 的 主观 打分 等 。 

例如 ， 在 八 数码 问题 中 ,h(x) 就 可 定义 为 : 节点 x 同 目标 节点 相 比 ， 不 在 目标 位 置 的 
数码 个 数 。 


























283 123 
如 : 初始 节点 X=1 4 目标 节点 =|8 4|， 初 始 节 点 中 数码 1、2、8 不 在 目标 位 置 ， 
765 765 




















因此 h(x)= 3。 
在 八 数码 问题 中 ， 我 们 还 可 以 把 h(x) 定义 为 : 每 个 节点 当前 位 置 距 目标 位 置 的 距离 
之 和 。 


283 123 
如 : wear 目标 节点 = ， 此 时 数码 1 距 目 标 位 置 距离 为 1， 数 码 2 
765 765 


距 目 标 位 置 距离 为 1， 数 码 8 距 目 标 位 置 距离 为 2， 因 此 h(x)= 1+1+2=4。 

启发 式 搜 索要 用 启发 函数 来 控制 搜索 过 程 ， 因 此 需要 在 原 有 搜索 算法 基础 上 再 增加 启发 
函 值 的 计算 与 传播 过 程 ， 并 且 由 启发 函数 值 来 确定 节点 的 扩展 顺序 。 

1. 全 局 择优 搜索 (最 好 优先 ) 

它 的 基本 思想 是 : 计算 OPEN 表 中 所 有 待考 查 节 点 的 启发 函数 值 h(x)， 从 中 选 出 最 优 
节点 ( 即 h (x) 值 最 小 ) 进行 扩展 ， 而 不 管 这 个 节点 出 现在 搜索 树 的 什么 地 方 。 

全 局 择优 搜索 算法 如 下 : 

Step 1 把 初始 节点 5S0 放 入 0PEN 表 中 ， 计 算 六 (So ) ; 

Step 2 若 OPPN 表 为 空 ， 则 搜索 失败 ， 退 出 ; 

Step 3 移出 OPEN 表 中 第 一 个 节点 NN 放 入 CLOSED 表 中 ， 并 和 冠 以 序号 n; 

Step 4 若 入 是 目标 节点 ， 则 搜索 成 功 ， 结 

Step 5 若 WV 不 可 扩展 ， 则 转 Step 2; 
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Step 6 扩展 N， 计算 每 个 子 节点 x 的 函数 值 h(x)， 并 将 所 有 子 节点 配 以 指向 NN 的 返回 
间 针 后 放 入 OPEN 表 中 ， 再 对 OPEN 表 中 的 所 有 子 节点 按 其 函数 值 大 小 以 升序 排序 ， 转 
Step 2。 

【 例 3-6】 用 全 局 择优 搜索 法 解 八 数码 难题 。 初 始 棋局 So ， 目 标 棋局 5,。 

解 ” 设 启发 函数 交 x) 为 节点 x 的 格局 与 目标 格局 相 比 数码 位 置 不 同 的 个 数 。 

由 图 3-9 可 见 此 八 数码 问题 的 解 为 : So 一 $1-S， 一 3S3 一 S。 


























图 3-9 全 局 择优 搜索 法 搜索 树 





2. 局 部 择优 搜索 算法 

扩展 节点 入 后 仅 对 NN 的 子 节点 按 启 发 函数 值 大 小 以 升序 排序 ， 再 将 它们 依次 放 入 OPEN 
表 的 首部 。 即 : 

Step 1 把 初始 节点 S60 放 入 OPEN 表 中 ,计算 h(50); 

Step 2 若 0PEN 表 为 空 ， 则 搜索 失败 ， 退 出 ; 

Step 3 移出 OPEN 表 中 第 一 个 节点 N 放 入 CLOSED 表 中 ， 并 冠 以 序号 n; 

Step 4 若 入 是 目标 节点 ， 则 搜索 成 功 ， 结 

Step 5 若 V 不 可 扩展 ， 则 转 Step 2; 

Step 6 扩展 N， 计 算 每 个 子 节点 x 的 函数 值 凡 (x) ， B 
并 将 NN 所 有 子 节点 配 以 指向 NN 的 返回 指针 ， 按 函数 值 大 
小 以 升序 排序 ， 依 次 放 入 OPEN 表 首 部 ， 转 Step 2。 A 

3. 分 支 界限 搜索 算法 

如 图 3-10 是 一 个 交通 图 ， 设 4 城 是 出 发 地 , 五 城 是 
目的 地 ， 边 上 的 数字 代表 两 城 之 间 的 交通 费 。 试 求 从 4 5 D 
到 巨 最 小 费用 的 旅行 路 线 。 人 
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图 中 边 上 附 有 的 数值 表示 边 的 一 种 度量 ( 如 交通 费 、 旅 行 时 间 、 距 离 等 )， 称 这 种 数值 
为 权 值 ， 而 把 边 上 附 有 数值 的 状态 图 称 为 加 权 状 态 图 或 赋 权 状态 图 。 

加 权 状 态 图 的 搜索 算法 ， 要 在 一 般 状 态 图 搜索 算法 基础 上 再 增加 权 值 的 计算 与 传播 过 
程 ， 并 且 节 点 的 扩展 顺序 要 考虑 权 值 。 基 于 加 权 状 态 图 的 搜索 算法 ， 有 分 支 界限 法 和 最 近 择 
优 法 。 

分 支 界限 搜索 算法 的 基本 思想 是 ， 每 次 从 0PEN 表 中 选 出 g(*) 值 最 小 的 节点 进行 
考查 。 

分 支 界限 搜索 算法 步骤 描述 如 下 : 

Step 1 把 初始 节点 S0 放 入 OPEN 表 中 ,计算 h(5o); 

Step 2 若 OPEN 表 为 空 ， 则 搜索 失败 ， 退 出 ; 

Step 3 移出 OPEN 表 中 第 一 个 节点 NN 放 入 CLOSED 表 中 ， 并 冠 以 序号 mi; 

Step 4 若 入 是 目标 节点 ， 则 搜索 成 功 ， 结 

Step 5 若 WV 不 可 扩展 ， 则 转 Step 2; 

Step 6 扩展 N， 计算 每 个 子 节点 x 的 函数 值 g(x) ,并 将 所 有 子 节点 配 以 指向 NN 的 返 
回 指针 后 放 入 OPEN 表 中 ， 再 对 OPEN 表 中 的 所 有 子 节 点 按 其 函数 值 大 小 以 升序 排序 ， 转 
Step2。 

这 种 搜索 算法 与 前 面 的 全 局 择优 算法 的 区 别 仅 是 选取 扩展 节点 的 标准 不 同 ， 一 个 是 代价 
值 g(x) 最 小 ,一 个 是 启发 函数 值 h(x) 最 小 。 这 就 是 说 ， 把 全 局 择优 算法 中 的 (x) 换 成 
g(%) 即 得 分 支 界限 法 算法 。 所 以 ， 从 算法 角度 考虑 ， 这 两 种 搜索 算法 实际 是 一 样 的 。 但 计 
算 节 点 的 代价 值 g(*) 与 计算 节点 的 启发 函数 值 h(x) 的 方法 则 完全 不 同 。 

在 搜索 过 程 中 会 产生 一 颗 不 断 增长 的 搜索 树 ， 一 个 节点 x 的 代价 值 g(x) 是 从 该 树 初始 
节点 $0 方向 计算 而 来 的 ， 其 计算 方法 为 : 




















g(S0)=0 
8B(Xi)= 8(%i) + C (vi, Xi) 

其 中 是 x 的 子 节 点 ，c(%;，%;) 表示 节点 x; 到 节点 x 的 代价 。 

代价 又 称 为 耗 散 。 

【 例 3-7】 如 图 3-10 是 一 个 五 城市 交通 图 ， 
设 4 城 是 出 发 地 , EF 城 是 目的 地 ， 用 分 支 界限 搜索 
算法 求 4 到 的 最 小 费用 路 径 。 

解 : 根据 算法 可 得 如 图 3-11 所 示 的 搜索 树 ， 
可 见 最 小 费用 路 径 为 : 4 ->C 一 D 一 hh。OPEN 表 及 
CLOSED 表 的 变化 过 程 从 略 。 解 路 径 为 4 一 
CD 一 下 。 

4. 最 近 择 优 〈 睹 子 爬 山 法 ) 

同上 面 的 情形 一 样 ， 这 种 方法 实际 同 局 部 择优 





























法 类 似 ， 区 别 也 仅 是 选取 扩展 节点 的 标准 不 同 ， 一 图 3-11 交通 图 问题 分 支 界限 搜 
个 是 代价 值 g(x) 最 小 ,一 个 是 启发 函数 值 h(x) 索 算法 的 搜索 树 





最 小 。 这 就 是 说 ， 把 局 部 择优 法 算法 中 的 h(x) 换 
成 g(x) 就 可 得 最 近 择 优 法 的 算法 。 算 法 步 又 描述 如 下 : 
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Step 1 把 初始 节点 So 放 入 OPEN 表 中 ,计算 h(50); 

Step 2 若 0PEN 表 为 空 ， 则 搜索 失败 ， 退 出 ; 

Step 3 移出 OPEN 表 中 第 一 个 节点 Y 放 和 人 CLOSED 表 中 ， 并 冠 以 序号 n; 

Step 4 若 入 是 目标 节点 ， 则 搜索 成 功 ， 结 束 ; 

Step 5 和 若 V 不 可 扩展 ， 则 转 Step 2; 

Step 6 扩展 N， 计算 每 个 子 节 点 x 的 函数 值 g(x) ， 并 将 N 所 有 子 节 点 配 以 指向 w 的 
返回 指针 ， 按 g(x) 函数 值 大 小 以 升序 排序 ， 依 次 放 入 OPEN 表 首 部 ， 转 Step 2。 

3.2.4 人 算法 及 A* 算 法 

1. 估价 函数 

利用 启发 函数 h(x) 引导 的 启发 式 搜索 ， 是 一 种 深度 优先 的 搜索 策略 。 虽 然 它 具 有 较 高 
的 搜索 效率 ， 但 不 一 定 能 得 到 最 优 解 。 所 以 ， 为 了 协调 搜索 效率 与 搜索 质量 ， 人 们 把 启发 函 
数 扩充 为 估价 函数 。 佑 价 函 数 的 一 般 形 式 为 : 

f(x)= g(x)+h( x) 

其 中 g(x) 为 从 初始 节点 56 到 节点 x 已 付出 的 代价 ,h(x) 是 启发 函数 ;， 即 估价 函数 
Kx) 是 从 初始 节点 $0 到达 节点 x 处 已 付出 的 代价 与 节点 x 到 达 目 标 节 点 Sg 的 接近 程度 估计 
值 之 和 。 

当 状 态 图 中 所 有 边 的 代价 都 是 1 (单位 耗 散 ) 时 ， 估 价 函 数 还 可 以 表示 为 : 

f(x)=d(%)+h(x) 

其 中 d(x) 表示 节点 x 的 深度 。 

2. A 算法 

A 算法 是 基于 估价 函数 /(x) 的 一 种 加 权 状 态 图 启发 式 搜索 算法 。 算 法 描述 如 下 : 

Step 1 把 附 有 (S56) 的 初始 节点 $0 放 入 OPEN 表 ; 

Step 2 若 0PEN 表 为 空 ， 则 搜索 失败 ， 退 出 ; 

Step 3 移出 OPEN 表 中 第 一 个 节点 N 放 入 CLOSED 表 中 ， 并 冠 以 顺序 编号 n; 

Step 4 若 入 是 目标 节点 ， 则 搜索 成 功 ， 结 束 ; 

Step 5 若 V 不 可 扩展 ， 则 转 Step 2; 

Step 6 扩展 N， 生 成 一 组 附 有 f(x) 的 子 节点 ， 对 这 组 子 节点 作 如 下 处 理 ; 

1) 考察 是 否 有 已 在 OPEN 表 或 CLOSED 表 中 存在 的 节点 ; 由 于 它们 被 第 二 次 生成 ， 因 
而 需要 考虑 是 否 修改 已 经 存在 于 OPEN 表 或 COLSED 表 中 的 这 些 节 点 及 其 后 裔 的 返回 指针 和 
f(x) 值 ， 修 改 原则 是 “ 抄 f(x) 值 小 的 路 走 ”; 

2) 对 其 余子 节点 配 上 指向 的 返回 指针 后 放 入 OPEN 表 中 ， 并 对 OPEN 表 按 f(x) 值 
以 升序 排序 ， 转 Step2。 

算法 中 节点 x 估价 函数 f(x) 的 计算 方法 是 : 

f(x;)= g(x;) +h( x;) 
= g(xi) +c( wi,%;) th( x;) (wj 是 Xi 的 子 节 点 ) 

至 于 h(x) 的 计算 公式 则 需 由 具体 问题 而 定 。 

【 例 3-8】 使 用 A 算法 求解 八 数码 问题 。 取 f(x)= d(x)+h(x)， 其 中 d(x) 为 节点 深 
度 ,， h(x) 为 不 在 位 数码 个 数 。 初 始 状态 为 S ， 目 标 状态 为 S,， 如 图 3-12 所 示 。 解 路 径 为 





《69) 





9》 人 工 智能 技术 





g° 

















图 3-12 八 数码 问题 A 算法 的 搜索 树 


通过 f(x) 的 定义 可 以 看 出 .如果 忽略 h(x) 分 量 ,， 即 取 h(x) 和 恒 为 0， 则 此 时 的 fx)= 
d(x) ， 这 时 的 A 算法 就 是 分 支 界限 搜索 算法 ,特别 地 ， 当 取 g(x)= d(x)， 则 此 时 的 A 算法 
就 是 广度 优先 搜索 算法 ， 如 果 和 忽略 g(x) 分 量 ， 即 取 g(x) 恒 为 0， 则 此 时 的 f(x)= h(x)， 
这 时 的 A 算法 就 是 全 局 择优 搜索 算法 。 

由 此 可 见 ，h(x) 有 利于 搜索 的 纵向 发 展 ， 可 提高 搜索 的 效率 ， 但 影响 完备 性 ， 而 g(x) 
可 提高 搜索 的 完备 性 ， 但 影响 搜索 效率 。 所 以 ,f(x) 恰好 是 二 者 的 折 中 。 但 在 确定 f(x%) 
时 ， 要 权衡 利 次 ,使 g(x) 或 d(x) 与 h(x) 的 比重 适当 、 取 值 合理 ， 这 样 ， 才 能 取得 理想 的 
效果 。 

前 面 已 经 讲 过 ， 宽 度 优 先 搜索 算法 是 完备 的 ， 而 通过 上 面 的 分 析 可 知 ，f(x) 取 值 越 小 ， 
搜索 的 完备 性 越 好 ,h(x) 人 恒 为 0 时 A 算法 就 是 宽度 优先 搜索 算法 ， 此 时 的 A 算法 也 是 完 
的 ,但 是 这 会 影响 搜索 效率 ， 而 下 面 的 A* 算法 是 对 h(x) 取 值 进行 限制 的 一 种 改进 型 的 A 
算法 ， 该 算法 对 有 (x) 取 值 进行 限制 ， 使 得 算法 兼顾 了 搜索 效率 与 搜索 质量 ， 理 论 分 析 已 证 
明 ，A ”算法 是 完备 的 。 

3. A ”算法 

如 果 对 A 算法 限制 其 估价 函数 中 的 启发 函数 h(x) 满足 对 所 有 的 节点 x 均 有 h(x) 志 hh* 
(x)， 其 中 h* (x) 是 从 节点 x 到 目标 节点 的 最 小 代价 。 此 时 的 A 算法 就 称 为 A* 算法，A”* 
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算法 是 完备 的 。 

A ”算法 也 称 为 最 佳 图 搜索 算法 。 它 是 著名 的 人 工 智能 学 者 Nilsson 提出 的 。 

算法 中 提 到 有 hh*(x) 是 节点 x 到 达 目 标 节 点 的 最 小 代价 ， 这 就 提出 一 个 问题 : 在 搜索 结 
束 前 ， 我 们 并 不 能 得 到 这 个 最 小 代价 h* (x) (因为 如 果 知 道 了 这 个 最 小 代价 ， 那 么 最 佳 解 
路 径 就 找到 了 ) ， 那 么 h(x) <h* (x) 是 否 不 可 判断 呢 ? 当然 不 是 ， 一 种 极端 的 情况 就 是 取 
h(x) 恒 为 0， 则 显然 对 任何 节点 x 都 有 h(x) 夸 h* (x)。 

在 例 3-8 中 ,f(x) 取 值 为 “不 在 目标 位 的 数码 个 数 ”， 假 设 对 节点 x 有 f(x)=n， 即 及 
个 数码 不 在 位 ， 由 于 每 次 只 能 移动 一 个 数码 ， 因 此 欲 使 所 有 数码 到 位 ， 实 际 移动 数码 的 次 数 
至 少 为 n 次 ( 即 实际 代价 h* (x) 最 少 为 n)， 即 有 (x) <h* (x)。 因 此 例 3-8 的 A 算法 是 A* 
算法 。 

前 面 提 到 ， 在 八 数码 问题 中 ， 我 们 还 可 取 h(x) 为 “所 有 不 在 目标 位 的 数码 距 目 标 位 置 
之 和 ”， 如 果 将 例 3-8 中 的 h(x) 取 为 “所 有 不 在 目标 位 的 数码 距 目 标 位 置 之 和 ”， 此 时 的 A 
算法 也 是 A* 算 法 ,该 问题 留 给 读者 思考 。 


3.3 与 或 图 搜索 























3. 3. 1 与 或 图 


本 章 3. 1 节 例 3-3 中 引入 的 与 或 图 3-4 是 一 个 特殊 的 与 或 图 一 一 与 或 树 ， 一 个 一 般 的 与 
或 图 如 图 3-13 所 示 。 

前 面 已 提 到 ， 与 或 图 问题 求解 过 程 就 是 在 一 个 与 或 
图 中 寻找 一 个 从 初始 节点 到 目标 节点 (目标 节点 可 能 是 
多 个 ) 的 路 径 问 题 。 但 与 或 图 中 的 解 路 径 一 般 不 是 像 状 
态 图 中 那样 的 线形 路 线 ， 而 是 图 或 树 型 “路 径 ” 。 因 此 ， 
一 般 称 这 种 路 径 为 解 图 或 解 树 。 所 以 ， 求 解 与 或 图 问题 
就 是 在 与 或 图 中 搜索 解 图 或 解 树 的 问题 。 

同 状态 图 一 样 ， 与 或 图 也 是 问题 求解 的 一 种 抽象 表 
示 。 事 实 上 ， 许 多 问题 的 求解 过 程 都 可 以 用 与 或 图 搜索 
来 描述 。 所 以 ， 研 究 与 或 图 搜索 也 具有 普遍 意义 。 ! 

用 与 或 图 搜索 来 描述 问题 的 求解 过 程 ， 就 是 将 原 问 图 3-13 一般 与 或 图 
题 通过 有 关 变 换 规则 不 断 分 解 (为 子 问 题 ) 或 变换 (为 
等 价 问题 ) ， 直 到 问题 分 解 或 变换 为 〈 即 归 约 为 ) 一 些 直 接 可 解 的 子 问题 ， 或 者 不 可 解 也 不 
能 再 分 解 或 变换 的 子 问题 为 止 。 然 后 根据 所 有 得 到 的 搜索 树 确 定 原 问题 的 可 解 性 。 如 果 可 
解 ， 则 由 搜索 树 找 出 解 图 或 解 树 。 

为 了 叙述 方便 ， 下 面 引 入 一 些 新 概念 ; 

本 原 问 题 : 直接 可 解 的 简单 问题 。 

终止 节点 : 本 原 问 题 对 应 的 节点 。 

端 节 点 : 在 与 或 图 ( 树 ) 中 无 子 节点 的 节点 。 

与 节点 : 一 个 节点 的 子 节 点 间 全 部 是 “与 ”关系 。 
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或 节点 : 一 个 节点 的 子 节 点 全 部 是 “或 ”关系 。 

注意 : 终止 节点 一 定 是 端 节 点 ， 但 端 节 点 不 一 定 是 终止 节点 。 

K 连接 符 : 如 果 节 点 集 {m ,mp ,是 节点 到 的 子 节点 ， 并 且 m、m 、…、 中 间 是 
“与 ”的 关系 ， 则 称 n 到 | nj ,ns,… ,ni| 间 的 连接 为 外 向 K 连 接 符 ,简称 kK 连接 符 。 

例如 ， 图 3-13 中 节点 ns 有 两 个 连接 符 , 1 连接 符 指向 ns，2 连接 符 指 问 节 点 集 { ni ,ns1 

可 解 节点 : 

1) 终止 节点 是 可 解 节点 ; 

2) 若非 终止 节点 具有 多 个 外 向 连接 符 ， 当 且 仅 当 至 少 有 一 个 连接 符 所 连接 的 子 节点 都 
能 解 ， 该 非 终 节 点 才 可 解 ; 














不 可 解 节点 : 
1) 不 是 终止 节点 的 端 节点 是 不 可 解 节点 ; 
2) 若非 终止 节点 具有 多 个 外 向 连接 符 ， 当 且 仅 当 任 一 连接 符 所 连接 的 子 节点 都 至 少 有 


一 个 不 可 解 ， 该 非 终止 节点 才 不 可 解 ; 
与 图 : 如 果 一 个 图 中 每 个 节点 都 只 有 一 个 外 向 连接 符 ， 则 此 图 称 为 与 图 。 


3. 3.2 与 或 图 搜索 


1. 基本 概念 

同 状 态 图 (或 图 ) 的 搜索 一 样 ， 与 或 图 的 搜索 过 程 也 是 不 断 地 扩展 节点 ， 并 配 以 返 
回 指针 ， 而 形成 一 棵 不 断 生 长 的 搜索 树 。 但 与 或 图 搜索 的 解 图 ( 树 ) ， 不 像 在 或 图 中 那 
样 只 是 简单 地 寻找 目标 节点 ， 而 是 边 扩 展 节 点 边 进行 逻辑 判断 ， 以 确定 初始 节点 是 否 
可 解 。 一 旦 能 够 确定 初始 节点 的 可 解 性 ， 则 搜索 停止 。 这 时 ,根据 返回 指针 便 可 从 搜 
索 树 中 得 到 一 个 解 图 ( 树 ) 。 所 以 ， 准 确 地 说 ， 解 图 ( 树 ) 实际 上 是 由 可 解 节点 形成 的 
一 个 子 图 ( 树 )， 这 个 子 图 ( 树 ) 的 根 为 初始 节点 ， 叶 为 终止 节点 ， 且 这 个 子 图 ( 树 ) 
还 一 定 是 与 图 ( 树 ) 。 

解 图 ( 树 ) 的 代价 : 分 为 和 代价 与 最 大 代价 两 种 。 

c(x,y) 表示 节点 x 到 其 子 节点 y 的 代价 〈 即 边 xy 的 代价 )， 则 节点 x 到 节点 集 wV 的 解 
图 0G' 的 代价 记 为 g(x)， 则 和 代价 可 递归 定义 如 下 : 

1) 若是 终止 节点 ，g(n)=0; 

2) 否 * 是 与 节点 ， 有 一 个 外 向 n 连接 符 连 至 yj 、y,、…、y,， 则 有 两 种 计算 公式 : 

Dae(x)= > le(r,y;) te(y;)| 


i=1 
上 式 称 为 和 代价 ; 
© g(x)= MAX|c(x,y;) tg(yi)| 
li=n 
上 式 称 为 最 大 代价 。 
(3) 对 非 终止 的 端 节点 x,， g(x)= % 
解 图 ( 树 ) 的 代价 定义 为 树 根 So 的 代价 。 
最 佳 ( 优 ) 解 图 : 是 具有 最 小 代价 的 解 图 。 
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【 例 3-9]】 如 图 3-14 所 示 的 与 或 树 ， ti\vio、\ t3、 ts、 
代价 均 为 w ; 因此 该 树 包 括 两 棵 解 树 ， 一 棵 解 树 由 So 、4 





ts 为 终止 节点 ; 、 玉 是 端 节点 ， 其 


、 石 和 妃 组 成 ; 另 一 棵 解 树 由 So、 


有 8 、 了 、5、4 和 上 右 组 成 。 在 此 与 或 树 中 ， 边 上 的 数字 是 该 边 的 代价 。 





图 3-14 与 或 树 及 其 解 树 


解 : 由 右边 的 解 树 : 

按 和 代价 : g(4)= 11, g(So)= 13 
按 最 大 代价 : g(4)=6, g(S0)=8 
由 左边 的 解 树 : 





按 和 代价 : g(G)=3, g(D)=4, g(B)=6, g(S0)=8 
按 最 大 代价 : g(G)=2, g(D)=3, g(B)=5, g(S0)=7 














显然 ， 若 按 和 代价 计算 ， 左 边 的 解 树 是 最 优 解 树 ， 其 代价 为 8; 若 按 最 大 代价 计算 ， 左 





边 的 解 树 仍然 是 最 优 解 树 ， 其 代价 是 7。 但 使 用 不 同 的 计算 代价 方法 得 到 的 最 优 解 树 有 可 能 








不 相同 。 
下 面 给 出 希望 树 的 定义 : 
1) 初始 节点 $0 在 希望 树 7 中 。 
2) 如 果 节 点 x 在 7 中 ， 则 . 


Q@ 如 果 x 只 有 一 个 连接 符 ， de 
设 训 所 连接 的 子 节点 为 |yn ， 


@ 如 果 * 具有 多 个 连接 符 说 ，h，…，k,， 


yw| ， 则 : 
k 
> {|c(x,yi) tg yi)| J 
i=1 
值 最 小 的 一 个 连接 符 及 其 所 连接 的 子 节 点 在 7 
中 。 其 中 & 是 节点 的 希望 函数 。 
图 3-15 中 设 根 结 点 在 希望 树 中 ， 设 每 条 边 的 代 
价 为 单位 耗 散 ， 则 3 连接 符 作 连 接 的 3 个 子 节 点 也 


在 希望 树 中 。 


ll 
Ny 


g=4 


09 
ll 


2=2 2g=1 g=1 


图 3-15 与 或 树 及 其 解 树 
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2.AO* 搜索 算法 

本 算法 的 目的 是 求 得 与 或 图 的 最 佳 解 图 。 

无 论 是 用 和 代价 法 还 是 最 大 代价 法 ， 当 要 计算 任 一 节点 x 的 代价 g(x) 时 ， 都 要 求 已 知 
其 子 节点 y, 的 代价 g(y; ) 。 但 是 ， 搜 索 是 自 上 而 下 进行 的 ， 即 先 有 父 节点 ， 后 有 子 节 点 ， 除 
非 节 点 x 的 全 部 子 节点 都 是 不 可 扩展 节点 ， 和 否则 子 节点 的 代价 是 不 知道 的 。 此 时 节点 x 的 代 
so te 息 定义 一 个 启发 函数 ， 由 

函数 估算 出 子 节点 入 的 代价 g(y;)， 然 后 再 按 和 代价 或 最 大 代价 算出 节点 x 的 代价 值 
有 了 g(x)， 节 点 xx 的 父 节 点 、 祖 父 节点 以 及 直到 初始 节点 56 的 各 先辈 节点 的 代价 g 
都 可 自 下 而 上 的 地 逐 层 推算 出 来 。 

当 节 点 y, 被 扩展 后 ， 也 是 先 用 启发 函数 估算 出 其 子 节点 的 代价 ， 然 后 再 算出 y, 的 g 值 。 
此 时 算出 的 y; 的 g 值 可 能 与 原先 估算 出 的 g(y;) 不 相同 ,这 时 用 算出 的 g 值 取代 原先 估算 
出 的 g(y;)， 并 且 按 此 g 值 自 下 而 上 地 重新 计算 各 先辈 节点 的 g 值 。 当 节点 y; 的 子 节点 又 被 
扩展 时 ， 上 述 过 程 又 要 重复 进行 一 遍 。 总 之 ， 每 当 有 新 一 代 的 节点 生成 时 ， 都 要 自 下 而 上 地 
重新 计算 其 先辈 节点 的 代价 g， 这 是 一 个 自 上 而 下 地 生成 新 节点 ， 又 自 下 而 上 地 计算 代价 g 
的 反复 进行 过 程 。 

在 搜索 过 程 中 ， 随 着 新 节点 的 不 断 生成 ， 节 点 的 代价 值 是 在 不 断 变 化 的 ， 因 此 希望 树 也 
在 不 断 变化 。 在 某 一 时 刻 ， 这 一 部 分 节点 构成 希望 树 ， 但 到 另 一 时 刻 ， 可 能 是 另 一 些 节 点 构 
成 希望 树 。 但 不 管 如 何 变 化 ， 任 一 时 刻 的 希望 树 都 必须 包含 初始 节点 So， 而 且 硕 望 树 总 是 
对 最 优 解 树 近 根部 分 的 某 种 估计 。 

AO* 搜索 算法 需要 根据 问题 特征 构造 一 个 启发 函数 (或 叫 希 望 函 数 ) g(x)， 并 要 求 
g(x%)<=g * (x%)。 其 中 x* (x) 是 以 节点 x 作为 初始 节点 构成 的 最 佳 解 图 的 代价 ， 类似 A x* 
中 的 hx* (x) ， 步 又 如 下 : 

Stepl 把 初始 节点 S0 放 入 OPEN 表 。 

Step2 从 当前 生成 的 搜索 树 (图 ) ， 构 造 以 50 为 根 的 希望 树 (图 ) 7。 

Step3 选 一 个 OPEN 表 和 了 共有 的 节点 N， 并 将 N 从 OPEN 表 移 出 放 入 CLOSED 表 ( 即 

选中 了 中 的 待 扩展 节点 进行 扩展 ) 。 

Step4 大 W 为 终止 节点 ， 则 做 下 列 工 作 ; 

1) 标记 V 为 可 解 节点 ; 

2) 把 w 的 先辈 节点 中 的 可 解 节点 标记 为 可 解 ; 

3) 如 果 初 始 节点 So 被 标记 为 可 解 ， 则 7 为 最 优 解 树 (图 )， 成功 退出 ，; 

4) 删 去 OPEN 表 中 这 样 的 节点 : 其 先辈 节点 已 经 可 解 。 

Step5 若 NN 不 是 终止 节点 且 不 可 扩展 ， 则 做 下 列 工作 : 

1) 标记 为 不 可 解 节点 ; 

2) 把 w 的 先辈 节点 中 的 不 可 解 节点 标记 为 不 可 解 ; 

3) 如 果 初 始 节点 So 被 标记 为 不 可 解 ， 失 败退 出 ; 

4) 删 去 OPEN 表 中 这 样 的 节点 : 其 先辈 节点 中 存在 不 可 解 节点 。 

Step6 若 NN 不 是 终止 节点 但 可 扩展 ， 则 做 下 列 工作 : 

1) 扩展 N， 产 生 N 的 所 有 子 节点 ; 

2) 把 这 些 子 节点 放 入 OPEN 表 中 ， 并 为 每 个 子 节点 配 以 指向 父 节 点 的 指针 ; 
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3) 计算 这 些 子 节点 的 g 值 及 先辈 节点 的 g 值 (递归 地 ) 。 

Step7 转 Step2。 

同 状态 图 搜索 一 样 ， 搜 索 成 功 后 ， 解 树 已 经 记录 在 CLOSED 表 中 。 这 时 需 按 指向 父 节 点 
的 指针 找 出 整个 解 树 。 

【 例 3-10】 如 图 3-16a 所 示 的 与 或 图 ， 设 初始 节点 为 No， 目标 节点 为 Ne6。、N;。 假 设 在 
扩展 过 程 中 生成 的 各 节点 的 启发 函数 值 分 别 是 g(N0)=3、g(N)=1、g(N)=2、g(N;)=3、 
g(Na)= 1、g(Ns)=2、g(Ne)=0、g(WNN;i)=0， 边 为 单位 耗 散 ， 请 使 用 AO "搜索 算法 求解 最 
佳 解 图 。 

解 : 

第 一 次 循环 ，Step 1 把 初始 节点 No 放 入 OPEN 表 ; Step 2 构造 希望 图 由 初始 节点 N 构 
成 ; Step 3 将 Nu 移出 OPEN 表 ， 放 人 CLOSED 表 ; Step 6 由 于 Ni 不 是 终止 节点 上 且 可 扩展 ， 
此 扩展 No, 产生 NM 的 所 有 子 节点 Ni 、N,、N3、Ns， 并 将 这 些 子 节点 依次 放 入 0PEN 表 ， 
转 Step 2， 此 时 生成 图 3-16b 所 示 的 部 分 搜索 图 。 

第 二 次 循环 : Step 2 根据 构造 希望 图 的 方法 ,构造 出 的 希望 图 7 由 No、N 、N 构成 
(如 图 3-16c 加 粗 部 分 ) ; Step 3 选 OPEN 表 与 希望 图 共有 的 一 个 节点 ， 不 妨 选 择 Wi ， 将 Ni 
移出 OPEN 表 放 入 CLOSED 表 ; Step 6 由 于 Ni 不 是 终止 节点 且 可 扩展 ， 因 此 扩展 NW ， 产 生 
Ni 的 子 节点 Ns。 此 时 得 到 如 图 3-16c 所 示 的 部 分 搜索 图 。 重 新 计算 Ni 及 其 他 各 祖先 节点 的 
g 值 ， 转 Step 2。 

第 三 次 循环 : Step 2 由 希望 图 的 构造 方法 ， 此 时 构造 出 的 希望 图 7 了 由 No、Ns 、N4 构 成 
(如 图 3-16d 加 粗 部 分 ) ; Step 3 选 OPEN 表 与 希望 图 共有 的 一 个 节点 ， 不 妨 选 择 N;，, 将 N， 
移出 OPEN 表 放 入 CLOSED 表 ; Step 6 由 于 NN; 不 是 终止 节点 且 可 扩展 ， 因 此 扩展 Ns;， 产生 
入 ;的 子 节点 Ne。 、N;。 此 时 得 到 如 图 3-16d 所 示 的 部 分 搜索 图 。 重 新 计算 N; 及 其 他 各 祖先 节 
点 的 g 值 ， 转 Step 2。 

第 四 次 循环 ，Step 2 由 希望 图 的 构造 方法 ， 此 时 构造 出 的 希望 图 7 如 图 3-16e 加 粗 部 分 ; 
Step 3 选 OPEN 表 与 希望 图 共有 的 一 个 节点 ,不 妨 选 择 N6 ,将 Ne 移出 OPEN 表 放 和 CLOSED 
表 ; Step 4 由 于 Ni 是 终止 节点 ， 除 了 需要 重新 计算 N3 及 其 他 各 祖先 节点 的 g 值 外 ， 还 有 逐 
层 倒 推 祖先 节点 的 可 解 性 ， 但 此 时 尚 不 能 判断 No 可 解 ， 转 Step 2。 

第 五 次 循环 ，Step 2 由 希望 图 的 构造 方法 ， 此 时 构造 出 的 希望 图 7 如 图 3-16f 加 粗 部 分 
(未 改变 ) ;Step 3 选 OPEN 表 与 希望 图 共有 的 一 个 节点 ， 不 妨 选 择 N4， 将 和 Vy 移 出 OPEN 表 
放 入 CLOSED 表 ; Step 6 由 于 NM 不 是 终止 节点 且 可 扩展 ， 因 此 扩展 N，， 产 生 和 Wi 的 子 节点 
NN;。 此 时 得 到 如 图 3-16f 所 示 的 部 分 搜索 图 。 重 新 计算 N 及 其 他 各 祖先 节点 的 g 值 ， 转 
Step 2。 

第 六 次 循环 : Step 2 由 希望 图 的 构造 方法 ， 此 时 构造 出 的 希望 图 7 如 图 3-16g 加 粗 部 分 ; 
Step 3 选 OPEN 表 与 希望 图 共有 的 一 个 节点 ， 此 时 只 能 选择 N;, 将 和 Nj 移出 OPEN 表 放 入 
CLOSED 表 ; Step 4 由 于 和 Vj 是 终止 节 ， 除 了 需要 重新 计算 Nj 及 其 他 各 祖先 节点 的 g 值 外 ， 
还 有 逐 层 标记 祖先 节点 的 可 解 性 ， 此 时 Vo 被 标记 为 可 解 ， 如 图 3-16g 加 粗 部 分 是 最 优 解 图 ， 
成 功 退 出 。 
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N2 
PNa N3 Na 
Ns 
b) 第 一 次 循环 生成 的 搜索 
No 
Neo YN 
a) 要 搜索 的 与 或 图 
名 Ni Ny 
N 
Ni Ns 3 Na 
和 2 
Na 
Ns Ns Ne ps 


9) 第 二 次 循环 生成 的 搜索 图 


NM 
d) 第 三 次 循环 生成 的 搜索 图 
No 
NM Ny 
Ns Na Ni Ny 
Ns 
Na 

Ns 

Ns 

e) 第 四 次 循环 生成 的 搜索 图 

Ne fy; 


f) 第 五 次 循环 生成 的 搜索 图 


No 
Ni Ny 
Na 
Ns 


8) 第 六 次 循环 生成 的 搜索 图 
到 3-16 AO“* 搜索 算法 搜索 过 程 

















通过 本 例 我 们 可 以 看 出 ， 在 本 算法 生成 希望 图 的 过 程 中 ,希望 图 是 动态 变化 的 (如 图 3-16c 


和 d)。 男 外 ， 根 据 本 算法 所 得 到 的 最 佳 解 图 也 不 一 定 是 唯一 的 ， 这 可 以 留 给 读者 思考 。 


3.4 博弈 图 搜索 


3. 4.1 博弈 图 




















夺 询 所 包括 的 范围 十 分 广 








在 本 章 的 例 3-3 中 我 们 通过 7 枚 钱币 问题 引入 了 博弈 问题 。 
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泛 ， 诸 如 下 槛 、 打 牌 、 竞 技 、 战 争 、 经 济 活动 等 诸多 竞争 性 的 智能 活动 都 属于 博弈 的 范畴 ， 
本 课程 主要 讨论 双人 完备 信息 博弈 问题 。 

所 谓 “ 双 人 完备 信息 博弈 ”是 指 : 对 鲍 双 方 轮流 走 步 ， 任 何 一 方 都 了 解 对 手 过 去 已 走 过 
的 棋 步 ， 而 且 还 能 够 估计 出 对 手 未 来 的 可 能 的 走 步 。 博 弈 的 结果 只 有 三 种 情况 : 胜 、 败 、 
平局 。 

在 博弈 过 程 中 ， 任 何 一 方 都 希望 自己 取得 胜利 。 因 此 ， 当 某 一 方 当 前 有 多 个 行动 方案 可 
供 选择 时 ， 他 总 是 挑选 对 自己 最 为 有 利 而 对 对 方 最 为 不 利 的 那个 行动 方案 。 假 设 我 方 为 
max， 对 方 为 min， 则 我 方 选 择 的 若干 行动 方案 之 间 是 “或 ”关系 ， 因 为 主动 权 操 在 我 方 手 
里 ,我 们 或 者 选择 这 个 行动 方案 ,或 者 选择 男 一 个 行动 方案 ,完全 由 我 方 决定 。 当 我 方 选取 
任 一 方案 走 了 一 步 后 ， 对 方 也 有 若干 个 可 供 选 择 的 行动 方案 ， 此 时 这 些 行动 方案 对 我 方 来 说 
它们 之 间 则 是 “与 ”关系 ， 因 为 这 时 主动 权 操 在 对 方 手 里 ， 这 些 可 供 选择 的 行动 方案 中 的 
任何 一 个 方案 我 方 都 要 应 对 。 

这 样 ， 把 上 述 博弈 过 程 用 图 表示 出 来 ， 则 得 到 的 是 一 个 “与 或 树 (图 )”。 描 述 博弈 过 
程 的 与 或 树 (图 ) 称 为 博弈 树 (图 )， 它 有 如 下 特点 : 

1) 博弈 的 初始 格局 是 初始 节点 。 

2) 博弈 树 中 ,“ 或 ”节点 和 “与 ”节点 是 逐 层 交替 出 现 的 。 自 己 一 方 扩展 的 节点 之 间 
是 “或 ”关系 ， 对 方 扩展 的 节点 之 间 是 “与 ”关系 。 双 方 轮流 地 扩展 节点 。 

3) max 必 胜 的 节点 对 应 的 是 终止 节点 (本 原 问 题 )， 即 可 解 节点 ; 所 有 使 对 方 必 胜 的 
节点 对 应 的 都 是 不 可 解 节点 。 

本 章 的 例 3-3 中 7 枚 钱币 问题 初始 状态 为 (7，min) ， 博 弈 图 如 图 3-17， 其 中 4、C 为 
不 可 解 的 端 节点 ，B 是 终止 节点 。 

























































































































































































(7, min) 
min 
o(4,3,max) max 
0 (4,1,1, 1,max) 7G3,2, 1, 1, max) *(2,2,2, 1, max) /4 max 
4 3,1,1,1, 1,min) $0,2,1,1, 1min) B i 
0,1,1,1,1,1, max) C max 


图 3-17 7 枚 钱币 问题 对 手 先 走时 的 博弈 图 














图 中 B 节点 为 min 必 胜 节点 ，4、C 节点 为 max 必 输 节点 ， 要 使 我 方 必 胜 ， 等 价 于 求 博 
弈 图 的 搜索 问题 ， 本 例 中 的 目标 节点 为 下 ， 显 然 ， 本 例 存 在 从 初始 节点 到 目标 节点 下 的 解 
图 ， 因 此 说 明 ， 当 对 方 先 走 时 我 方 存 在 必 胜 的 走 步 方案 。 

前 面 已 经 提 到 ， 由 于 实际 问题 的 复杂 性 ， 往 往 不 可 能 得 到 完整 的 博弈 图 ( 树 )， 因 
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此 我 们 采取 的 方法 一 般 是 随 着 博弈 
展 的 博弈 图 进行 评估 ， 以 决定 后 续 





























过 程 的 进行 ， 只 扩展 出 部 分 博弈 图 ， 然 后 对 已 经 扩 
专 询 图 如 何 扩展 ， 所 采用 的 方法 一 般 是 极 大 极 小 分 


























析 法 。 
3. 4.2 极 大 极 小 分 析 法 
基本 思想 : 


1) 假设 我 方 为 max， 即 为 max 寻找 最 优 方案 。 
2) 对 各 种 方案 产生 的 后 果 进 行 量化 分 析 ， 即 计算 可 能 得 分 。 
为 计算 得 分 ， 需要 根据 问题 的 特性 信息 定义 一 个 估价 函数 f(x)， 用 来 估算 当前 博弈 树 
端 节 点 的 得 分 。 此 时 佑 算出 来 的 得 分 称 为 静态 估 值 。 
一 般 规 定 : 有 利于 max 的 势 态 , Kx ) 值 取 正 ，max 必 胜 时 取 f(x) 为 正 无 穷 。 
势均力敌 (不 能 确定 ) : f(x)=0 
有 利于 min 的 势 态 , Kx) 值 取 负 ，min 必 胜 时 取 f(x) 为 负 无 穷 。 
3) 当 端 节点 的 估 值 计算 出 来 后 ， 再 推算 出 父 节 点 的 得 分 ,推算 的 方法 是 : 
对 “或 ”节点 ， 选 其 子 节 点 中 一 个 最 大 的 得 分 和 为 父 节 点 的 得 分 ; 
对 “与 ”节点 选 其 子 节点 中 一 个 最 小 的 得 分 作为 父 节点 的 得 分 。 
这 样 计算 出 的 父 节点 的 得 分 称 为 倒 推 值 。 
4) 如 果 一 个 行动 方案 能 获得 较 大 的 倒 推 值 ， 则 它 就 是 当前 最 好 的 行动 方案 。 
【 例 3-11】 如 图 3-18， 已 知 当前 博弈 图 及 端 节 点 的 静态 估 值 (叶子 节点 所 标 值 ) ， 求 
初始 节点 的 倒 推 值 。 



































7 2 4 过 4 -2 63 4 54 6-5 6-5 96 32 6 3 


图 3-18 求 博弈 图 的 倒 推 值 














解 : 按照 从 下 到 上 的 过 程 ， 对 于 与 节点 ， 取 所 有 子 节 点 中 最 小 的 得 分 作为 父 节 点 的 得 
分 ; 而 对 于 或 节点 ， 选 其 子 节 点 中 一 个 最 大 的 得 分 和 为 父 节 点 的 得 分 。 从 下 到 上 逐 层 计算 
(图 3-18) ， 最 后 计算 出 初始 节点 的 倒 推 值 为 3。 

在 博弈 问题 中 ， 每 一 个 格局 可 供 选 择 的 行动 方案 都 有 很 多 ， 因 此 会 生成 十 分 庞大 的 
韦 弈 树 。 据 统计 ， 西 洋 跳 棋 完整 的 博弈 树 约 有 10%” 个 节点 。 试 图 利用 完整 的 博弈 树 来 
进行 极 小 极 大 分 析 是 困难 的 。 可 行 的 办 法 是 只 生成 一 定 次 度 的 博弈 树 ， 然 后 进行 极 小 
极 大 分 析 ， 找 出 当前 最 好 的 行动 方案 。 在 此 之 后 ， 再 在 已 选 定 的 分 支 上 生成 一 定 深 度 
的 博弈 树 ， 再 选 最 好 的 行动 方案 。 如 此 进行 下 去 ， 直 到 取得 胜 败 的 结果 为 止 。 至 于 每 
次 生成 博弈 树 的 深度 ， 当 然 是 越 大 越 好 ， 但 由 于 受到 计算 机 存储 空间 的 限制 ， 只 好 根 
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据 实 际 情 况 而 定 。 

【 例 3-12】 如 图 3-19 是 一 字 棋 游戏 〈 即 我 们 所 熟悉 的 五 子 连 游戏 的 简化 ) 。 设 有 
如 图 3-19a 所 示 的 九 个 空格 ， 由 4、 中 二 人 对 弈 ， 并 设 我 方 为 4， 对 方 为 8。 轮 到 谁 走 
棋 谁 就 往 空 格 上 放 一 只 自己 的 棋子 ， 谁 先 使 自己 的 棋子 构成 “三 子 成 一 线 ” 谁 就 取得 
了 胜利 。 

设 4 的 棋子 用 “@” 表 示 , B 的 棋子 用 “OO” 表示 。 为 了 不 至 于 生成 太 大 的 博弈 树 ， 
假设 每 次 仅 扩展 两 层 。 估 价 函 数 定义 如 下 : 

设 棋 局 为 已， 估价 函数 为 e(P) 。 

1) 若 P 是 4 必 胜 的 棋局 ， 则 e(P)= +oo 。 

2) 知已 是 有 必 胜 的 槛 局 ， 则 e(P)= -oo 

3) 若 忆 是 胜 负 未 定 的 棋局 ， 则 e(P) = Ca 

其 中 e(+P) 表示 棋局 P 中 空白 位 置 放 满 黑 棋 ， 使 得 黑 棋 三 子 成 一 线 的 数目 ; e(-P) 表 
示 棋 局 P 上 空白 位 置 放 满 白 棋 ， 使 得 白 棋 三 子 成 一 线 的 数目 。 例 如 ， 对 于 图 3-19b 所 示 的 棋 
局 ， 则 









































































































































e(P)= 6-4=2 
男 外 ,假定 具有 对 称 性 的 两 个 棋局 算 作 一 个 棋局 。 
还 假定 4 先 走 棋 ， 我 们 站 在 4 的 立场 上 。 O 〇 
图 3-20 给 出 了 4、B 各 走 一 着 棋 所 生成 的 部 分 博弈 bd 
树 。 图 中 节点 旁 的 数字 分 别 表示 相应 节点 的 静态 估 值 或 
倒 推 值 。 由 图 可 以 看 出 ， 对 于 4 来 说 最 好 的 一 着 棋 是 $; ， a) b) 


因为 5; 比 S, 和 5, 有 较 大 的 倒 推 值 。 
在 4 走 $; 这 一 着 棋 后 ，B 的 最 优选 择 是 5,， 因 为 
一 着 棋 的 静态 估 值 较 小 ， 对 4 不 利 ,不论 电 选择 5 
We 以 决定 下 一 步 应 该 如 何 
走 棋 ， 其 过 程 与 上 面 类 似 ， 不 再 重复 。 














图 3-19 一 字模 
































ole 






































图 3-20 A、B 双方 各 走 一 步 所 生成 的 部 分 博弈 树 
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3.4.3 剪 枝 技术 


上 述 的 极 小 极 大 分 析 法 ， 实 际 是 先生 成 一 棵 一 定 深度 的 完整 的 博弈 树 ， 然 后 再 根据 叶子 
节点 的 静态 估 值 计算 侄 推 值 。 这 样 做 的 缺点 是 生成 的 博弈 树 节点 多 、 效 率 低 。 于 是 ， 人 们 又 
在 极 小 极 大 分 析 法 的 基础 上 ， 提 出 了 a-B 剪 校 技术 。 

这 一 技术 的 基本 思想 是 ,， 边 生成 博弈 树 边 计算 评估 各 节点 的 倒 推 值 ， 并 且 根 据 评估 出 的 
倒 推 值 范围 ， 及 时 停止 扩展 那些 已 无 必要 再 扩展 的 子 节点 ， 即 相当 于 剪 去 了 博弈 树 上 的 一 些 
分 校 ， 从 而 节约 了 机 器 开销 ， 提 高 了 搜索 效率 。 

具体 的 剪 梳 方法 如 下 : 

1) 按照 有 界 深度 优先 搜索 算法 扩展 博弈 树 ， 即 每 次 扩展 只 扩展 出 一 定 座 度 的 博弈 树 中 
的 一 条 边 。 

2) 对 于 一 个 与 节点 min， 若 能 估计 出 其 倒 推 值 的 上 确 界 B6， 并 且 这 个 6 值 不 大 于 min 的 
父 节 点 (一定 是 或 节点 ) 的 估计 倒 推 值 的 下 确 界 a， 即 a 二 B， 则 停止 扩展 该 min 节点 的 其 
余子 节点 (因为 这 些 节 点 的 估 值 对 min 父 节 点 的 倒 推 值 已 无 任何 影响 了 ) 。 这 一 过 程 称 为 a 
剪 枝 〈ea 剪 校 一 定 发 生 在 与 节点 上 ) 。 

3) 对 于 一 个 或 节点 max， 知 能 估计 出 其 倒 推 值 的 下 确 界 w， 并 且 这 个 a 值 不 小 于 max 
的 父 节 点 〈 一 定 是 与 节点 ) 的 估计 倒 推 值 的 上 确 界 B， 即 =>B， 则 停止 扩展 该 max 节点 的 
其 余子 节点 〈 因 为 这 些 节 点 的 佑 值 对 max 父 节点 的 倒 推 值 已 无 任何 影响 了 ) 。 这 一 过 程 称 为 
有 剪 校 〈B 剪 校 一 定 发 生 在 或 节点 上 ) 。 

【 例 3-13】 如 图 3-21， 按照 从 左 到 右 的 扩展 顺序 ， 使 用 w-B 剪 校 ， 标 出 所 发 生 的 剪 枝 
位 置 及 剪 枝 类 型 。 





































































































图 3-21 oa-8 剪 枝 例 


解 : 按照 从 左 到 右 的 扩展 顺序 ， 首 次 扩展 只 扩展 出 So 一 4 一 B 一 C， 然 后 计算 端 节 点 C 
的 静态 估 值 (图 中 已 给 出 , 为 7)。 

此 时 尚 不 能 确定 节点 B 的 倒 推 值 ， 因 此 ， 进 行 第 二 次 扩展 ， 扩 展 出 节点 D， 然 后 计算 出 
节点 B 的 倒 推 值 为 2。 

此 时 虽然 尚 不 能 确定 节点 4 的 倒 推 值 ， 但 是 ， 由 于 节点 4 是 或 节点 ， 其 倒 推 值 来 自 所 
有 子 节点 中 倒 推 值 最 大 者 ， 因 此 ， 我 们 可 以 估计 出 节点 4 的 倒 推 值 至 少 为 2 ( 即 =2)。 

扩展 节点 4 一 E 一 了， 计算 端 节 点 下 的 静态 估 值 为 -1。 

由 于 节点 五 还 有 其 他 节点 尚未 被 扩展 ， 因 此 此 时 尚 不 能 确定 节点 五 的 倒 推 值 。 但 是 由 
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于 节点 是 与 节点 ， 因 此 可 以 断定 ， 节 点 最 终 的 倒 推 值 不 会 大 于 -1。 但 是 前 面 已 经 分 析 
过 ， 节 点 五 的 父 节 点 B 的 倒 推 值 至 少 为 2， 因 此 ， 节 点 B 的 倒 推 值 一 定 不 会 来 自 节 点 ， 因 
此 继续 扩展 节点 记 的 其 他 子 节 点 已 毫 无 意义 ， 因 此 边 EC 被 剪 掉 ， 节 点 的 倒 推 值 就 确定 为 
-1。 由 于 该 边 是 与 节点 上 的 边 ， 因 此 该 剪 枝 为 a 剪 枝 。 

同样 ， 节 点 五 上 也 发 生 了 一 个 a 剪 枝 ， 节 点 五 的 倒 推 值 就 确定 为 1。 

由 于 节点 4 的 所 有 子 节 点 的 倒 推 值 都 被 确定 ， 所 以 节点 4 的 倒 推 值 确定 为 2。 

此 时 初始 节点 $6 的 倒 推 值 还 不 能 被 确定 ,但 是 由 于 $6 是 与 节点 ， 所 以 知道 其 倒 推 值 最 
大 不 超过 2。 

继续 扩展 边 S50 一 J 一 KL，50 一 J 一 KM， 计算 节 点 的 倒 推 值 为 6。 

由 于 节点 J 是 或 节点 ,虽然 尚未 扩展 /的 其 他 边 , 但 是 可 以 确定 节点 J 的 最 终 倒 推 值 不 
会 小 于 6， 而 节点 了 的 父 节 点 $6 的 倒 推 值 至 多 为 2， 因 此 56 的 倒 推 值 不 可 能 来 自 节 点 J， 因 
此 ， 继 续 扩展 节点 J 已 毫 无 意义 ， 因 此 节点 J 的 其 他 边 被 剪 掉 (这 是 B 剪 校 ) ， 因 此 节点 了 
的 倒 推 值 就 确定 为 6。 

最 后 ， 计 算出 节点 $0 的 倒 推 值 为 2。 


习题 






























































. 常用 的 盲目 搜索 算法 有 哪些 ? 
. 什么 是 状态 图 搜索 ? 
. 广度 优先 搜索 的 基本 思想 是 什么 ? 

与 穷 举 搜索 相 比 ， 启 发 式 搜索 有 什么 优点 ? 
. 简 述 A 算法 与 A"* 算法 的 区 别 。 
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第 4 章 
专家 系统 


专家 系统 是 人 工 智 能 从 科学 研究 转向 实际 应 用 ， 从 一 般 思 维 方法 探讨 转向 专门 知识 运用 
的 重大 突破 。1968 年 ,美国 斯 坦 福 大 学 的 费 根 鲍 姆 成 功 研 制 出 了 第 一 个 专家 系统 
DENDRAL， 这 是 一 种 用 于 分 析 化 合 物 分 子 结构 的 专家 系统 。 之 后 ， 专 家 系统 的 研究 得 到 了 
迅速 发 展 ， 并 广泛 应 用 于 医疗 、 化 学 、 地 质 、 气 象 、 军 事 以 及 控制 等 诸多 领域 中 。 目 前 ， 专 
家 系统 成 为 人 工 智 能 中 最 活跃 且 最 有 成 效 的 研究 领域 之 一 。 它 在 理论 上 继承 并 运用 人 工 智能 
的 基本 思想 与 方法 ,但 是 在 系统 结构 、 开 发 方法 及 工具 等 方面 又 形成 了 自己 的 体系 。 


4.1 专家 系统 的 概述 























4.1.1 专家 系统 的 概念 与 特点 


专家 系统 (expert system , ES) 是 一 种 模拟 人 类 专家 解决 领域 问题 的 计算 机 程序 系统 。 
它 运 用 特定 领域 的 专门 知识 和 经 验 ， 通 过 推理 和 判断 来 模拟 人 类 专家 才能 解决 的 各 种 复 困 
的 、 上 有 具体 的 问题 ， 达 到 与 专家 具有 同等 的 解决 问题 的 能 力 ， 它 能 对 决策 的 过 程 做 出 解释 ， 并 
具有 学 习 功 能 。 

专家 系统 一 般 具 有 如 下 一 些 基 本 特点 : 

1. 具有 专家 知识 及 推理 能 

专家 系统 要 能 像 人 类 专家 那样 工作 ， 一 方面 要 具有 专家 级 的 知识 ， 另 一 方面 还 必须 具有 
利用 专家 知识 进行 推理 、 判 断 和 决策 的 能 力 ， 从 而 解决 复杂 困难 问题 。 现 实生 活 中 ， 大 部 分 
问题 都 是 非 公 式 化 的 ， 如 医疗 诊断 、 法 律 推 理 、 市 场 预测 等 ， 都 可 以 使 用 专家 系统 ， 利 用 经 
验 知 识 ， 通 过 推理 决策 解决 新 问题 ， 并 不 断 利 用 新 经 验 丰 富 专家 知识 库 。 

2. 具有 灵活 性 

专家 系统 的 体系 结构 通常 采用 知识 库 与 推理 机 相 分 离 的 构造 原则 ， 它 们 彼此 独立 又 有 联 
系 。 这 样 既 可 以 在 系统 运行 时 能 根据 具体 问题 的 不 同 ， 分 别 选取 合适 的 知识 构成 不 同 的 求解 
序列 ， 实 现 对 问题 的 求解 ， 又 可 以 在 对 一 方 进行 修改 时 不 致 影响 到 男 一 方 。 例 如 ， 知 识 库 要 
像 人 类 专家 那样 不 断 地 学 习 、 更 新 知识 ， 因 此 要 经 常 对 它 进行 增删 、 修 改 操 作 。 由 于 知识 
库 与 推理 机 分 离 ， 这 就 不 会 因 知识 库 的 变化 而 要 求 修改 推理 机 的 程序 。 

3. 具有 透明 性 

为 了 提高 用 户 对 系统 的 可 信 程度 ， 专 家 系统 一 般 都 设置 了 解释 机 构 ， 用 于 向 用 户 解释 它 
的 行为 动机 ， 以 及 得 出 某 些 答案 的 推理 过 程 和 依据 ， 使 用 户 能 比较 清楚 地 了 解 系统 处 理 问题 
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的 过 程 及 使 用 的 知识 和 方法 。 例 如 ， 一 个 医疗 诊断 专家 系统 诊断 患者 患 有 感冒 ， 并 使 用 某 些 
药品 ， 就 必须 向 病人 说 明 为 什么 得 出 如 此 的 结论 。 男 外 ， 专 家 系统 的 解释 功能 ， 可 使 系统 设 
计 者 及 领域 专家 方便 地 找 出 系统 隐 含 的 错误 ， 便 于 对 系统 进行 维护 。 


4. 1.2 专家 系统 和 传统 程序 的 区 别 


从 专家 系统 的 概念 上 讲 ， 专 家 系统 也 是 一 个 程序 系统 ， 但 它 是 具有 知识 推理 的 智能 计算 
机 程序 ， 与 传统 的 计算 机 应 用 程序 有 着 本 质 上 的 不 同 : 

首先 ， 专 家 系统 求解 问题 的 知识 不 再 隐 含 在 程序 和 数据 结构 中 ， 而 是 单独 构成 一 个 知识 
库 。 它 已 经 使 传统 的 “数据 结构 + 算法 = 程序 ”的 应 用 程序 模式 变化 为 “知识 + 推理 = 系统 ” 
的 模式 。 

其 次 ， 由 于 专家 系统 解决 问题 的 知识 库 与 处 理 知 识 的 推理 机 相 分 离 ， 因 此 它 具 有 一 定 的 
独立 性 和 通用 性 。 知 识 库 是 领域 知识 的 集合 ， 它 通常 以 知识 库 文件 的 形式 存在 ， 可 方便 地 进 
行 更 新 。 而 传统 程序 将 知识 和 知识 的 处 理 都 编 成 代码 ， 当 知识 改变 时 ， 传统 程 序 只 能 重新 编 
码 与 调试 ， 而 对 于 专家 系统 ， 只 需要 更 新 知识 库 即 可 。 

总 之 ， 与 传统 程序 相 比 ， 专 家 系统 的 可 维护 性 好 ， 易 于 修改 和 扩充 ， 更 加 适合 处 理 模 糊 
性 、 经 验 性 的 问题 ， 并 能 解释 结论 的 过 程 。 与 人 类 专家 相 比 ， 专 家 系统 可 以 帮助 人 类 专家 更 
系统 地 总 结 经 验 知识 ， 并 对 这 些 知识 进行 推广 与 完善 ， 而 且 它 的 使 用 费用 低廉 ， 不 受 外 界 环 
境 和 情绪 的 影响 ， 可 安装 在 不 适 于 人 类 工作 的 恶劣 环境 。 


4.1.3 专家 系统 的 类 型 


按照 专家 系统 的 特性 及 功能 ， 其 可 分 为 如 下 10 个 类 型 . 

(1) 解释 型 专家 系统 ”能够 通过 已 知 数据 和 信息 的 分 析 和 推理 ,给 出 相应 的 解释 ， 确 

定 它 们 的 含义 ， 如 信号 解释 、 化 学 结构 说 明 、 医 疗 解释 、 图 像 分 析 等 专家 系统 。 例 如 ， 用 于 
化 学 结构 分 析 的 DENDRAL 专家 系统 、 石 油 测 井 数 据 分 析 的 ELAS 专家 系统 以 及 地 质 勘 探 数 
据 解 释 的 PROSPECTOR 专家 系统 等 。 
(2) 诊断 型 专家 系统 ”能 够 根据 获取 到 的 现象 、 数 据 或 事实 等 信息 推断 出 某 个 对 象 或 
系统 是 否 存 在 故障 ， 并 给 出 故障 的 原因 以 及 排除 故障 的 方案 等 。 这 类 专家 系统 是 目前 开发 最 
多 、 应 用 最 广 的 一 类 专家 系统 。 例 如 ， 用 于 抗生素 治疗 的 MYCIN 专家 系统 、 肝 功能 检测 的 
PUFF 专家 系统 、 青 光 眼 治疗 的 CASNET 专家 系统 、 计 算 机 硬件 故障 诊断 的 DART 专家 系 
统 等 。 

(3) 预测 型 专家 系统 ”根据 过 去 和 现在 的 数据 或 经 验 等 已 知 信息 ， 推 断 未 来 可 能 发 生 
或 出 现 的 情况 。 例 如 ， 气 象 预 报 、 人 口 预测 、 经 济 预 测 以 及 病虫害 预测 等 专家 系统 。 

(4) 设计 型 专家 系统 根据 给 定 的 设计 要 求 进行 相应 的 设计 。 通 常 ， 这 类 专家 系统 要 
在 满足 指定 约束 条 件 下 给 出 最 优 或 较 优 的 设计 方案 。 例 如 ， 用 于 计算 机 系统 配置 的 XCON 
专家 系统 以 及 VLSI 电路 设计 的 KBVLSI 专家 系统 等 。 

(5) 规划 型 专家 系统 ”能够 按照 给 定 目标 拟定 总 体 规 划 、 行 动 计划 以 及 运筹 优化 等 ， 
适用 于 机 器 人 动作 控制 、 交 通 运 输 调 度 、 通 信和 与 军事 指挥 、 生 产 规划 等 。 例 如 ， 机 器 人 规划 
系统 NOAH 、 制 定 有 机 合成 规划 的 SECS 专家 系统 以 及 帮助 空军 制定 攻击 敌 方 机 场 计划 的 
TATR 专家 系统 等 。 
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(6) 控制 型 专家 系统 ”能够 自 适应 地 控制 整个 系统 的 行为 ， 使 之 满足 预 其 要求， 通常 
适用 于 大 型 设备 或 系统 的 控制 。 例 如 ， 帮 助 监 控 和 控制 MVS 操作 系统 的 YES/MVS 专家 
系统 。 

(7) 监督 型 专家 系统 ”完成 实时 的 监控 任务 ， 并 根据 监控 到 的 数据 或 现象 做 出 相应 的 
分 析 和 人 处理。 例如 ， 帮 助 操作 人 员 检 测 和 处 理 核 反应 堆 事 故 的 REACTOR 专家 系统 。 

(8) 修理 型 专家 系统 ”能 够 对 发 生 故 障 的 设备 或 系统 进行 处 理 ， 排 除 故障 ， 并 使 其 恢 
复 正 常 工作 ,通常 应 具有 诊断 、 调 试 、 计 划 和 执行 的 功能 。 例 如 ， 美 国 贝尔 实 验 室 的 ACI 
电话 和 有 线 电 视 维 护 修理 专家 系统 。 

(9) 教学 型 专家 系统 ”能 够 根据 学 生 的 特点 有 针对 性 地 选择 适当 的 教学 内 容 或 教学 手 
段 ， 对 学 生 进行 教学 或 辅导 ， 主 要 用 于 辅助 教学 。 例 如 ， 讲 授 有 关 细 菌 传染 性 疾病 知识 的 计 
算 机 辅助 教学 系统 GUIDON。 

(10) 调试 型 专家 系统 ”能 够 根据 相应 标准 对 存在 错误 的 对 象 进行 检测 ， 并 给 出 适用 于 
当前 错误 的 最 佳 调试 方案 ， 用 于 排除 错误 。 调 试 型 专家 系统 可 用 于 对 新 产品 或 新 系统 的 调 
试 ， 也 可 用 于 维修 站 对 设备 进行 调整 、 测 量 或 实验 。 


4.2 专家 系统 的 结构 


专家 系统 的 结构 是 指 专家 系统 各 组 成 部 分 的 构造 和 组 织 形式 。 专 家 系统 的 有 效 性 与 系统 
结构 选择 是 否 恰当 有 着 直接 的 关系 。 存 放 知 识 和 使 用 知识 是 专家 系统 的 两 个 基本 功能 ， 而 分 
别 实现 这 两 个 功能 的 知识 库 和 推理 机 是 构成 专家 系统 的 核心 部 件 。 由 于 专家 系统 所 需要 完成 
的 任务 不 同 ， 所 以 其 系统 结构 没有 统一 的 模式 。 图 4-1 是 理想 的 专家 系统 结构 ， 包 括 : 知识 
库 、 推 理 机 、 综 合 数据 库 、 人 机 接口 、 解 释 机 构 和 知识 获取 机 构 。 图 4-1 中 各 部 分 功能 说 明 


如 下 。 
综合 数据 库 推理 机 






























知识 获取 机 构 


图 4-1 理想 专家 系统 结构 


1. 知识 库 

知识 库 (Knowledge Base) 是 专家 系统 的 核心 部 件 之 一 ， 它 主要 的 功能 是 存储 和 管理 专 
家 系统 中 的 知识 。 它 包括 两 种 类 型 的 知识 : 一 类 是 相关 领域 中 定义 、 事 实 、 理 论 等 收录 在 学 
术 著 作 中 的 事实 性 的 数据 ; 一 类 是 专家 在 长 期 实践 中 的 实践 经 验 ， 具 有 局 发 性 。 在 知识 库 
中 ， 这 两 类 知识 都 必须 以 一 定 的 规范 形式 表示 。 

2. 推理 机 
推理 机 (Reasoning Machine) 是 专家 系统 的 思维 机 构 ， 是 专家 系统 的 核心 部 件 之 一 。 推 
理 机 的 任务 是 模拟 领域 专家 的 思维 过 程 ， 根 据 知识 库 中 的 知识 ， 按 一 定 的 推理 方法 和 控制 策 
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略 进 行 推 理 ， 直 到 推理 出 问题 的 结论 。 推 理 机 和 知识 库 是 专家 系统 的 基本 框架 ， 二 者 相 辅 相 
成 、 密 不 可 分 。 不 同 的 知识 有 不 同 的 推理 方式 ， 所 以 ， 推 理 机 还 包含 如 何 从 知识 库 中 选择 可 
用 推理 规则 的 策略 和 当 多 个 可 用 规则 冲突 时 的 解决 策略 。 

3. 综合 数据 库 

综合 数据 库 (Global Database) 又 称 全 局 数据 库 、 工 作 存 储 器 、 黑 板 。 它 用 于 存放 专家 
系统 工作 过 程 中 所 需要 求解 问题 的 初始 数据 、 推 理 过 程 中 的 中 间 结 果 及 最 终结 果 等 信息 的 集 
合 。 它 是 一 个 动态 的 数据 库 ， 在 系统 工作 过 程 中 产生 和 变化 。 综 合 数 据 库 中 数据 的 表示 与 知 
识 库 中 知识 的 表示 通常 一 致 ， 从 而 推理 机 能 方便 地 使 用 知识 库 和 综合 数据 库 中 的 信息 求解 
问题 。 

4. 人 机 接口 

人 机 接口 (Interface) 是 系统 和 用 户 间 的 桥梁 ， 用 户 通过 人 机 接口 输入 必要 的 数据 、 提 
出 问题 、 获 得 推理 结果 及 系统 的 解释 ; 系统 通过 人 机 接口 要 求 用 户 回答 系统 的 询问 ， 回 答 用 
户 的 提问 。 

5. 解释 机 构 
解释 机 构 (Expositor) 的 功能 是 向 用 户 解释 专家 系统 的 行为 ， 包 括 解释 “系统 怎样 得 出 
这 一 结论 "” “系统 为 什么 提出 这 样 的 问题 ”等 需要 向 用 户 解 释 的 问题 ， 为 用 户 了 解 推理 过 程 
及 系统 维护 提供 方便 ,体现 了 系统 透明 性 。 

6. 知识 获取 机 构 

知识 获取 机 构 是 实现 专家 系统 将 专业 领域 的 知识 与 经 验 转化 为 计算 机 可 利用 的 形式 ， 并 
送 入 知识 库 的 功能 模块 。 它 同时 也 具有 修改 、 更 新 知识 库 的 功能 ， 维 护 知识 库 的 完整 性 与 一 
致 性 。 

































































4.3 专家 系统 的 设计 原则 与 开发 过 程 


专家 系统 是 复杂 的 计算 机 软件 系统 ， 它 的 开发 既 要 遵守 软件 工程 的 基本 原则 ， 又 要 考虑 
到 基于 知识 的 特殊 性 ， 与 一 般 软 件 系 统 的 设计 有 重要 的 区 别 。 


4. 3. 1 专家 系统 的 设计 原则 


建立 一 个 方便 、 有 效 、 可 靠 、 可 维护 的 专家 系统 ， 要 遵守 以 下 设计 原则 。 

1. 确定 求解 问题 的 领域 

专家 系统 是 针对 某 一 问题 领域 的 ， 因 此 在 设计 专家 系统 之 前 首先 要 确定 所 面向 的 问题 领 
域 。 问 题 领域 如 果 太 小 会 使 求解 问题 能 力 较 弱 ; 如 果 太 大 又 使 知识 库 过 于 庞大 而 不 能 保证 知 
识 的 质量 ， 从 而 影响 系统 的 效率 ， 难 以 维护 管理 。 要 做 到 恰当 地 确定 问题 领域 范围 应 该 从 两 
个 角度 进行 考虑 : 一 是 明确 系统 设计 目标 ， 它 是 确定 求解 问题 的 基础 ， 使 设计 的 系统 能 满足 
设计 目标 所 规定 的 各 种 问题 ; 二 是 根据 可 获取 的 专家 知识 水 平 ， 合 理 地 确定 求解 问题 的 领 
域 ， 即 如 果 可 获得 的 专家 知识 有 限 ， 那 么 就 只 能 缩小 问题 的 领域 ， 和 否则 不 能 得 到 准确 的 回 
答 。 总 之 ， 确 定 恰当 的 问题 领域 受到 设计 目标 和 专家 知识 的 限制 ， 二 者 互相 制约 ， 又 相 畏 
相 成 。 
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2. 获取 完备 的 知识 

知识 是 专家 系统 的 基础 ， 它 是 建立 高 效 、 可 靠 的 专家 系统 的 前 提 条 件 。 完 备 的 知识 是 指 
知识 的 数量 满足 求解 问题 的 需要 ， 并 保证 知识 的 一 致 性 与 完整 性 等 。 因 此 ， 要 求知 识 工程 师 
与 领域 专家 精密 合作 ， 除 了 建立 初始 较 完整 的 知识 库 外 ， 还 要 使 系统 在 运行 过 程 中 具有 获取 
知识 的 能 力 及 对 知识 进行 动态 检测 和 及 时 修正 错误 的 能 

3. 知识 库 与 推理 机 分 离 

知识 库 和 推理 机 分 离 是 专家 系统 的 一 个 重要 特点 ， 可 方便 实现 知识 库 的 维护 与 管理 。 另 
外 ， 由 于 推理 机 可 灵活 设计 , 便于 控制 ， 所 以 在 推理 机 修改 时 不 会 影响 知识 库 。 

4. 设计 合适 的 知识 表示 模式 

知识 在 专家 系统 中 以 一 定 的 形式 来 表示 ， 不 同 领域 的 问题 都 有 各 自 的 特点 ， 应 该 用 相应 
的 表示 模式 表示 该 领域 知识 。 所 以 ， 在 选择 设计 知识 表示 模式 时 应 该 充分 考虑 领域 问题 的 特 
点 ， 使 它 能 充分 表示 知识 。 另 外 ， 也 应 把 知识 表示 模式 与 推理 模型 结合 起 来 作 统筹 考虑 ， 使 
二 者 密切 配合 ， 高 效 地 求解 领域 问题 。 

5. 模拟 领域 专家 思维 过 程 求解 问题 

专家 系统 的 特点 之 一 就 是 能 模拟 专家 推理 复杂 的 问题 ， 在 设计 专家 系统 时 ， 要 模拟 专家 
的 思维 方法 ， 像 专家 那样 学 习 知 识 ， 利 用 知识 和 经 验 ， 通 过 思维 判断 ， 求 解 问题 。 

6. 建立 友好 的 人 机 交互 环境 

人 机 接口 是 专家 系统 与 用 户 交流 的 媒介 ， 因 此 为 了 让 设计 的 专家 系统 能 被 用 户 接受 ， 充 
分 发 挥 它 的 作用 , 产生 效益 ， 就 要 在 设计 专家 系统 时 ， 充 分 了 解 用 户 的 实际 情况 、 知 识 水 
平 ， 建 立 适 合用 户 ， 方 便 使 用 的 友好 交互 环境 。 用 户 可 以 通过 它 与 专家 系统 对 话 ， 求 解 需要 
解决 的 问题 。 

7. 渐 增 式 的 开发 策略 

专家 系统 是 一 个 复杂 的 程序 系统 ， 建 立 过 程 需要 较 长 的 时 间 ， 一 方面 是 因为 系统 本 身 复 
杂 需 要 设计 知识 库 、 数 据 库 、 推 理 机 、 解 释 机 等 模块 ， 工 作 量 大 ; 另 一 方面 ， 所 设计 的 知识 
表示 模式 及 推理 机 不 一 定 完全 符合 领域 问题 的 实际 情况 ， 需 要 一 边 建立 、 一 边 验证 、 一 边 修 
正 ， 所 以 专家 系统 的 开发 与 评价 是 并 行 的 ， 以 便 及 时 发 现 问 题 、 及 时 修正 ; 还 有 ， 参 加 设计 
的 专家 人 员 结 构 层 次 不 同 、 专 业 不 同 ， 合 作 需 要 一 定时 间 。 因 此 ， 专 家 系统 的 开发 过 程 通常 
采用 渐 增 式 的 开发 策略 ， 先 建立 一 个 专家 系统 原型 ， 然 后 对 系统 进行 各 种 试验 ， 在 取得 经 验 
的 基础 上 ， 再 逐步 形成 比较 完备 的 专家 系统 。 


4.3.2 专家 系统 的 开发 过 程 


专家 系统 的 开发 需要 一 个 周期 ， 称 为 生命 周期 ， 即 专家 系统 的 开发 过 程 是 一 个 生命 周 
期 ， 它 主要 包括 7 个 阶段 : 需求 分 析 、 系 统 设计 、 知 识 获 取 、 编 程 调试 、 原 型 测试 、 修 正 与 
扩充 、 系 统 包装 及 总 调 。 

1. 需求 分 析 

需求 分 析 是 指 知识 工程 师 和 领域 专家 合作 对 领域 问题 进行 调查 研究 ， 确 定 专家 系统 的 目 
标 和 任务 ， 进 行 可 行 性 分 析 ， 调查 的 主要 内 容 有 : 专家 系统 的 目标 和 任务 ; 用户 对 系统 功 
能 、 性 能 的 需求 ; 领域 专家 求解 问题 的 模式 ; 专家 系统 将 要 面向 用 户 的 情况 ; 专家 系统 开发 
的 软 硬 件 环境 ; 专家 系统 的 开发 时 间 及 进度 要 求 等 。 
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2. 系统 设计 

系统 设计 阶段 完成 的 任务 包括 : 确定 专家 系统 的 类 型 、 体 系 结构 ;确定 知识 的 表示 模式 
及 知识 库 的 结构 ; 确定 总 体 的 求解 策略 ; 确定 与 用 户 的 接口 方式 ; 选择 系统 的 软 硬 件 及 开发 
工具 。 

3. 知识 获取 

这 一 阶段 的 主要 任务 是 : 获取 专家 处 理 问 题 的 方法 与 思路 ， 获 得 专家 经 验 知识 ; 查阅 资 
料 ， 获 得 领域 知识 ; 对 知识 进行 分 析 、 比 较 、 归 纳 与 整理 ， 找 出 知识 间 的 内 在 联系 及 规律 ; 
把 整理 出 来 的 知识 用 系统 设计 过 程 中 的 知识 表示 模式 表示 出 来 。 

4. 编程 与 调试 

按 系 统 设 计 所 确定 的 功能 模块 进行 程序 设计 ， 并 且 对 各 功能 模块 进行 调试 ， 同 时 也 要 对 
各 功能 模块 进行 联合 调试 ， 检 查 程序 设计 中 是 否 有 错误 。 

5. 原型 测试 

经 过 编程 与 调试 之 后 ， 形 成 专家 系统 的 原型 。 测 试 时 使 用 典型 实例 ， 这 些 实例 的 结果 已 
知 ， 而 且 要 选择 有 代表 性 的 实例 ， 使 系统 各 主要 部 分 及 各 应 用 区 间 能 被 充分 地 测试 到 。 测 试 
的 内 容 应 该 包括 : 可 靠 性 、 知 识 的 一 致 性 、 工 作 效 率 、 解 决 问题 的 能 力 等 。 

6. 修正 与 扩充 

测试 后 ， 发 现 问题 并 及 时 的 修正 ， 比 如 说 求解 问题 的 方法 是 否 合适 ; 知识 的 表示 形式 是 
否 合理 等 。 无 论 哪个 环节 出 现 问题 ， 都 要 进行 修正 。 所 以 在 设计 专家 系统 之 初 ， 要 经 过 认真 
细致 的 前 期 准备 工作 ， 尽 量 减少 修正 过 程 。 另 外 ， 除 了 修正 问题 外 ， 还 要 根据 测试 结果 对 系 
统 进 行 扩充 ， 使 各 环节 功能 进一步 完善 。 

7. 系统 包装 及 总 调 

要 根据 用 户 的 需求 ， 设 计 友 好 的 人 机 界面 ， 对 系统 进行 总 调 ， 生 成 各 类 说 明文 件 或 使 用 
说 明 等 相关 文件 。 


4.4 专家 系统 评价 


专家 系统 评价 一 直 贯 穿 于 专家 系统 的 整个 建立 过 程 中 ， 从 需求 分 析 开 始 到 最 后 调试 ， 都 
要 进行 反复 的 评价 ， 及 时 发 现 问题 并 修正 问题 。 如 何 评价 一 个 专家 系统 ， 主 要 从 以 下 几 个 方 
面 和 人 手 : 

首先 ， 评 价 知识 的 完备 性 及 其 表示 方法 的 适当 性 ， 即 设计 的 专家 系统 是 否 具有 求解 领域 
问题 的 全 部 知识 ， 知 识 是 否 与 专家 经 验 保持 一 致 。 同 时 ， 知 识 的 表示 形式 是 否 合适 ， 决 定 着 
能 否 有 利于 对 知识 的 利用 ， 有 利于 提高 推理 效率 ， 是 否 便于 维护 与 管理 。 

其 次 ， 评 价 求解 问题 的 质量 及 系统 效率 。 求 解 问题 的 质量 主要 体现 在 两 个 方面 : 一 是 推 
出 的 结果 是 否 与 客观 实际 结果 一 致 ; 二 是 推理 的 结果 与 专家 的 结论 符合 程度 。 系 统 效率 是 指 
系统 运行 时 对 系统 资源 的 利用 率 ， 一 个 效率 低 的 系统 用 户 是 难以 接受 的 。 

另外 ， 系 统 的 可 维护 性 、 系 统 人 研制 时 间 、 效 益 等 也 是 系统 评价 的 指标 。 一 个 专家 系统 的 
研制 时 间 应 与 系统 的 规模 、 复 杂 性 相 适 应 。 同 时 系统 的 后 期 维护 同样 重要 ， 这 是 专家 系统 能 
长 期 工作 的 保证 。 
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4.5 MYCIN 专家 系统 实例 分 析 


MYCIN 系统 是 20 世纪 70 年 代 由 斯 坦 福 大 学 研制 的 一 种 帮助 医生 对 细菌 感染 患者 进行 
诊断 和 治疗 的 专家 系统 。 该 系统 能 够 根据 患者 具体 情况 给 出 建议 性 的 诊断 结果 和 治疗 处 方 。 

MYCIN 系统 采用 LISP 语言 编写 ， 整 个 系统 仅 有 245KB， 知 识 库 中 有 200 多 条 细菌 血 症 
规则 ， 可 对 约 50 种 细菌 进行 识别 。MYCIN 系统 的 结构 图 如 图 4-2 所 示 。 


动态 数据 库 
























知识 获取 模块 






图 4-2 MYCIN 系统 的 结构 图 


MYCIN 系统 的 咨询 模块 是 推理 机 与 用 户 的 接口 。 用 户 在 使 用 MYCIN 系统 时 ， 先 启动 咨 
询 子 系统 ， 系 统 将 给 出 提示 ， 要 求 输入 病人 的 基本 信息 ， 如 姓名 、 年 龄 、 症 状 等 。 然 后 根据 
知识 库 中 存储 的 知识 进行 推理 运算 ， 给 出 病人 所 得 疾病 及 治疗 方案 。 
MYCIN 系统 采用 反 向 推理 的 控制 策略 ， 推 理 过 程 形成 由 若干 规则 链 构成 的 与 或 树 ， 
MYCIN 系统 采用 深度 优先 方法 进行 搜索 ， 并 使 用 基于 可 信 度 的 不 精确 推理 。 
MYCIN 系统 的 解释 模块 负责 回答 用 户 的 问题 。 例 如 , “为 何 需要 输入 某 一 参数 ?” “如 
何 得 出 这 样 的 结论 ?” 等 。 系 统 通过 记录 所 形成 的 与 或 树 来 实现 解释 功能 。 
MYCIN 系统 的 知识 获取 模块 用 来 更 新 和 完善 知识 库 。 专 家 可 利用 该 模块 将 新 知识 补充 
到 知识 库 中 。 
MYCIN 系统 的 动态 数据 库 用 来 存储 和 记录 与 病人 相关 的 各 种 动态 变化 信息 ， 包 括 基本 
数据 、 化 验 结果 以 及 推理 结论 等 。 动 态 数 据 库 中 的 数据 根据 它们 之 间 的 关系 形成 一 棵 上 下 文 
树 。 树 中 的 每 个 节点 对 应 一 个 具体 对 象 ， 结 点 称 为 上 下 文 ， 如 图 4-3 所 示 。 












































从 图 4.3 给 出 的 上 下 文 树 中 可 以 看 出 ， 病 人 提 i 
取 了 2 种 培养 物 ， 培 养 物 中 分 离 出 了 对 应 的 有 机 ”> 
体 ， 有 机 体 1 有 相应 的 药物 1 和 药物 2 进行 治疗 ， 。 蕴 关 和 培养 物 》 “Q 手术 1 
病人 进行 1 次 手术 ， 手 术 时 用 了 对 应 的 手术 药物 3。 
由 此 可 见 ， 上 下 文 树 能 够 将 病人 的 培养 物 、 培 养 物 。 ym ro 


得 到 的 有 机 体 以 及 有 机 体 对 应 的 药物 情况 清晰 地 描 / 

述 出 来 。 2 i 
MYCIN 系统 的 知识 库存 储 用 于 诊断 和 治疗 的 

专家 知识 以 及 推理 所 需 的 静态 知识 。 采 用 产生 式 规 

则 进行 知识 表示 ， 共 有 大 约 500 条 传染 血液 病 的 知识 规则 ， 例 如 ， 第 050 规则 为 
下 : 感染 是 原 发 性 菌 血 症 ， 且 培养 基 是 一 种 无 菌 基 ， 且 细菌 侵入 位 置 是 肠胃 ; 
CH: 0.7; 


图 4-3 ”上下文 树 实例 
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THEN : 细菌 本 名 是 严寒 毛 菌 。 

其 中 ，IF 代表 规则 的 前 提 ，THEN 代表 规则 的 结论 ，CH 表示 前 提 对 结论 的 支持 程度 ， 
称 为 确定 性 系数 。MYCIN 采用 不 精确 推理 的 工作 方式 ， 因 此 利用 确定 性 系数 表示 模糊 
关系 。 

为 了 给 出 对 应 病人 的 处 方 (REGIMEN)， 系 统 调用 目标 规则 092 进行 反问 推理 。 规 则 
092 如 下 : 

下 存在 一 种 病菌 需要 处 理 ， 某 种 病菌 虽然 没有 出 现在 目前 的 培养 物 中 ， 但 已 经 注意 到 











它们 需要 处 理 ; 

THEN 根据 病菌 对 药物 的 过 敏 情况 ， 编 制 一 个 可 能 抑制 该 病菌 的 处 方 表 ， 从 处 方 表 中 选 
择 最 佳 的 处 方 。 

ELSE 病人 不 必 治 疗 。 


MYCIN 系统 利用 MONITOR 和 FINDOUT 两 个 子 程序 完成 咨询 和 推理 过 程 。MONITOR 的 
功能 是 分 析 规 则 的 前 提 条 件 是 否 满足 ， 从 而 决定 拒绝 还 是 使 用 该 规则 。MONITOR 将 每 次 鉴 
定 的 前 提 结 果 记 录 在 动态 数据 库 中 ， 如 果 条 件 中 所 涉及 的 临床 参数 未 知 ， 则 调用 FINDOUT 
去 得 到 相关 信息 。FINDOUT 的 功能 是 查找 MONITOR 所 需 的 参数 。 对 于 化 验 数据 ，FINDOUT 
先 向 用 户 咨 询 ， 如 果 获 取 不 到 结果 ， 则 运用 知识 库 进行 推导 ;对 于 非 化 验 数 据 ，FINDOUT 
先 运用 知识 库 进 行 推导 ， 如 果 得 不 到 所 需 结 果 ， 则 向 用 户 咨询 。 

当 目 标 规则 的 前 提 条 件 成 立 ， 也 就 是 诊断 结果 为 “病人 患 有 细菌 感染 ”，MYCIN 系统 先 
生成 可 能 的 “治疗 方案 表 ”， 然 后 再 从 表 中 为 该 病人 选取 最 佳 用 药 配 方 。 

“治疗 方案 表 ” 根 据 诊 断 出 的 细菌 特征 ， 结 合 知 识 库 中 的 相应 规则 产生 ， 例 如 : 

IF 细菌 的 特征 是 假 单 胞 菌 

THEN 建议 如 下 治疗 药物 : 

粘 菌 素 (有 效 性 : 0. 98) 

多 粘 菌 素 (有 效 性 : 0. 96) 

庆 大 霉 素 (有 效 性 : 0. 96) 

羧 下 青霉素 (有 效 性 : 0. 96) 

硫 代 异 唑 (有效 性 : 0. 96 ) 

MYCIN 系统 根据 各 药物 对 细菌 治疗 的 有 效 性 、 药 物 是 否 已 用 过 以 及 药物 副作用 等 因素 
综合 考虑 ， 给 出 最 优 的 用 药 配 方 。 

MYCIN 系统 利用 知识 获取 模块 获取 新 的 知识 和 规则 。 为 了 防止 知识 的 错误 更 新 ， 
MYCIN 系统 还 采用 了 二 级 存储 方法 ， 也 就 是 新 知识 必须 经 过 试 运行 ， 验 证 其 可 靠 后 才能 加 
入 到 规则 库 中 。 但 MYCIN 系统 的 学 习 功 能 是 十 分 有 限 的 ， 例 如 ， 新 规则 涉及 的 参数 和 节点 
类 型 不 能 超越 系统 已 有 种 类 ， 并 且 新 旧 规 则 之 间 的 冲突 处 理 也 不 够 全 面 。 尽管 如 此 ， 
MYCIN 系统 在 专家 系统 发 展 过 程 中 的 影响 非常 大 。 首 先 ， 它 解决 了 现实 世界 中 的 实际 问题 。 
其 次 ，MYCIN 系统 验证 了 解释 机 、 知 识 自 动 获取 、 智 能 指导 等 新 概念 。 另 外 ， 它 验证 了 专 
家 系统 外 党 (SHELL) 的 可 行 性 。 之 前 的 专家 系统 利用 软件 将 知识 库 中 的 知识 与 推理 机 集 
成 起 来 ， 形 成 单一 系统 。 而 MYCIN 系统 将 知识 库 与 推理 机 分 开设 计 ， 这 样 ， 专 家 系统 的 基 
本 核心 可 以 重用 。 将 新 领域 的 知识 替换 原 有 的 旧 知 识 ， 可 以 到 达 快 速 创 建新 的 专家 系统 的 效 
果 。 去 掉 医 学 知识 的 MYCIN 外 壳 称 为 EMYCIN ( 空 的 MYCIN)。 
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此 外 ，MYCIN 系统 还 通过 了 如 下 的 人 机 测试 : MYCIN 系统 与 斯 坦 福 大 学 医学 院 的 9 名 
感染 病 医 生 分 别 对 10 例 感染 源 不 清 的 患者 进行 诊断 ， 并 给 出 处 方 ， 并 由 8 位 专家 对 诊断 结 
果 进 行 评判 。 评 判 涉及 两 个 内 容 ， 中 所 开 处 方 是 否 对 症 、 有 效 ; 名 所 开 处 方 是 否 对 其 他 可 能 
的 病原 体 也 有 效 ， 而 且 药 量 又 不 过 量 。 在 相互 隔离 的 情况 下 ， 对 第 中 项 的 评判 结果 是 
MYCIN 和 三 位 医生 所 开 的 处 方 对 症 、 有 效 ; 对 第 @) 项 的 评判 结果 为 MYCIN 系统 胜 过 9 位 医 
生 ， 显 示 出 更 好 的 水 平 。MYCIN 至 今 仍 是 一 个 有 代表 性 的 专家 系统 。 


4.6 专家 系统 开发 工具 























建造 专家 系统 需要 领域 专家 与 知识 工程 师 的 密切 合作 ， 通 常 需要 几 十 年 才能 完成 一 个 实 
用 的 系统 。 从 理论 上 说 ， 开 发 专家 系统 可 以 使 用 任何 一 种 计算 机 程序 设计 语言 。 然 而 ， 用 这 
种 方法 建造 专家 系统 需要 从 零 开始 ， 必 然 会 降低 工作 效率 ， 开 发 周期 将 更 加 漫长 。 为 提高 专 
家 系统 的 开发 效率 、 质 量 和 自动 化 水 平 ， 共 享 已 经 成 功 运行 的 专家 系统 所 取得 的 成 果 ， 人 们 
研制 出 各 种 开发 专家 系统 的 工具 ， 作 为 设计 和 开发 专家 系统 的 辅助 手段 和 环境 。 这 种 开发 工 
具 或 环境 ， 称 为 专家 系统 开发 工具 。 

专家 系统 开发 工具 是 20 世纪 70 年 代 中 期 开始 发 展 的 ， 它 比 我 们 所 熟知 的 如 FORTRAN 、 
PASCAL、C、LISP 和 PROLOG 等 一 般 的 计算 机 高 级 语言 具有 更 强 的 功能 。 可 以 认为 ， 专 家 
系统 工具 是 一 种 更 高 级 的 计算 机 程序 设计 语言 。 

现 有 的 专家 系统 工具 ， 主 要 分 为 骨架 型 工具 (又 称 外 党 )、 语 言 型 工具 、 构 造 辅助 工具 
和 支撑 环境 等 。 


4. 6. 1 骨架 型 开发 工具 


一 个 专家 系统 一 般 至 少 包 括 知识 库 、 推 理 机 、 解 释 程序 等 ， 而 规则 集 存 于 知识 库 内 。 专 
家 系统 强调 推理 机 与 知识 库 的 分 离 ， 在 一 个 理想 的 专家 系统 中 ， 推 理 机 完全 独立 于 知识 库 ， 
即 推理 机 与 求解 问题 的 领域 无 关 ， 系 统 功能 的 改变 只 依赖 于 规则 集 的 改变 。 由 此 ， 借 用 以 前 
开发 好 的 专家 系统 的 推理 机 部 分 ， 而 用 新 领域 的 知识 库 替 换 原 有 领域 的 知识 库 ， 这 样 形成 的 
工具 称 为 骨架 型 工具 ， 如 EMYCIN 、KAS 以 及 EXPERT 等 。 这 类 工具 因 其 控制 策略 是 预先 给 
定 的 ， 使 用 起 来 很 方便 ， 用 户 只 需 将 具体 领域 的 知识 明确 地 表示 成 为 一 些 规则 就 可 以 了 。 这 
样 ， 可 以 把 主要 精力 放 在 具体 概念 和 规则 的 整理 上 ， 而 不 是 像 使 用 传统 的 程序 设计 语言 建立 
专家 系统 那样 ， 将 大 部 分 时 间 花 费 在 开发 系统 的 过 程 结构 上 ， 从 而 大 大 提高 了 专家 系统 的 开 
发 效率 。 这 类 工具 由 于 其 推理 机 等 各 个 模块 都 是 成 熟 的 、 经 过 反复 检验 的 产品 ， 因 此 具有 系 
统 工作 稳定 可 靠 、 功 能 完善 等 特点 。 

骨架 型 开发 工具 属于 专用 开发 工具 ， 因 其 程序 的 主要 骨架 是 固定 的 ， 除 了 规则 外 ， 用 户 
不 可 改变 任何 东西 ， 因 而 骨架 型 工具 只 能 应 用 于 与 原 有 系统 非常 相近 的 领域 ， 只 能 用 来 解决 
与 原 系 统 相 类 似 的 问题 。 

EMYCIN 是 一 个 典型 的 骨架 型 工具 ， 它 是 由 著名 的 用 于 对 细菌 感染 病 进 行 诊断 的 
MYCIN 系统 发 展 而 来 的 ， 因 而 它 所 适应 的 对 象 是 那些 需要 提供 基本 情况 数据 ， 并 能 提供 解 
释 和 分 析 的 咨询 系统 ， 尤 其 适合 于 诊断 这 一 类 演绎 问题 。 这 类 问题 有 一 个 共同 的 特点 是 具有 
大 量 的 不 可 靠 的 输入 数据 ， 并 且 其 可 能 的 解 空间 是 事先 可 列举 出 来 的 。 
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语言 型 工具 与 骨架 型 工具 不 同 ， 属 于 通用 的 专家 系统 开发 工具 。 它 们 并 不 与 具体 的 体系 
和 范例 有 紧密 的 联系 ， 也 不 偏 于 具体 问题 的 求解 策略 和 表示 方法 ， 所 提供 给 用 户 的 是 建立 专 
家 系统 所 需要 的 基本 机 制 ， 其 控制 策略 也 不 固定 于 一 种 或 几 种 形式 ， 用 户 可 以 通过 一 定 手段 
来 影响 其 控制 策略 。 因 此 ， 语 言 型 工具 的 结构 变化 范围 广泛 ， 表 示 灵 活 ， 所 适应 的 范围 要 比 
上 骨架 型 工具 广泛 得 多 , 像 OPS5、0OPS83、RLL、PROLOG 及 ROSIE 等 ， 均 属于 这 一 类 工具 。 
OPS5 是 面向 产生 式 系统 的 语言 ， 它 内 部 配备 了 正 向 推理 机 构 ， 使 用 者 只 要 输入 产生 式 形式 
的 知识 和 事实 ， 系 统 就 靠 内 部 的 推理 机 制 获 得 问题 的 解 。PROLOG 语言 是 面向 一 阶 谓词 逻辑 
的 语言 ， 内 部 配备 了 逆向 推理 机 构 ， 使 用 者 也 只 要 输入 一 阶 谓 词 形式 的 知识 和 事实 ， 系 统 就 
能 自动 求 出 若干 个 解 。 

然而 功能 上 的 通用 性 与 使 用 上 的 方便 性 是 一 对 矛盾 ,语言 型 工具 为 维护 其 广泛 的 应 用 范 
围 ， 不 得 不 考虑 众多 的 在 开发 专家 系统 中 可 能 会 遇 到 的 各 种 问题 ， 因 而 使 用 起 来 比较 困难 ， 
用 户 不 易 掌握 ， 对 于 具体 领域 知识 的 表示 也 比 骨架 型 工具 困难 一 些 ， 而 且 在 与 用 户 的 对 话 方 
面 和 对 结果 的 解释 方面 也 往往 不 如 骨架 型 工具 。 

语言 型 工具 中 一 个 较 典 型 的 例子 是 OPS5， 它 以 产生 式 系统 为 基础 ， 综 合 了 通用 的 控制 
和 表示 机 制 ， 向 用 户 提供 建立 专家 系统 所 需要 的 基本 功能 。 在 OPS5 中 ,预先 没有 规定 任何 
符号 的 具体 含义 和 符号 之 间 的 任何 关系 ， 所 有 符号 的 含义 和 它们 之 间 的 关系 ， 均 由 用 户 所 写 
的 产生 式 规 则 所 决定 ， 并 且 将 控制 策略 作为 一 种 知识 对 待 ， 同 其 他 的 领域 知识 一 样 地 被 用 来 
表示 推理 ， 用 户 可 以 通过 规则 的 形式 来 影响 系统 所 选用 的 控制 策略 。 

这 类 工具 的 特点 是 适用 范围 较 广 ， 但 生成 的 专家 系统 运行 效率 较 低 ， 且 这 类 工具 不 易 掌 
握 ， 需 要 有 一 定 的 软件 专业 知识 。 著 名 的 专家 系统 RI 就 是 利用 OPS5 写成 的 。 


4.6.3 构造 辅助 工具 


构造 辅助 工具 是 介 于 通用 与 专用 之 间 的 一 种 开发 工具 。 它 提供 几 种 专家 系统 的 框架 组 件 
(如 推理 框架 、 黑 板 框 架 等 )， 每 个 框架 又 由 若干 模块 组 成 。 根 据 设计 者 的 需求 说 明 ， 系 统 
将 上 自动 生成 具有 一 定 领域 针对 性 的 专家 系统 。 它 主要 分 成 两 类 ， 一 类 是 设计 辅助 工具 ， 男 一 
类 是 知识 获取 辅助 工具 。 这 类 开发 工具 有 AGE 、TEIRESIAS 等 。 

AGE 是 由 美国 斯 坦 福 大 学 用 INTERLISP 语言 实现 的 专家 系统 工具 ， 这 一 系统 能 帮助 知 
识 工 程 师 设计 和 构造 专家 系统 。AGE 给 用 户 提 供 了 一 整套 像 积 木 块 那样 的 组 件 ， 利 用 它 能 
够 “装配 ”成 专家 系统 。 它 包括 以 下 4 个子 系统 : 

1) 设计 子 系统 : 在 系统 设计 方面 指导 用 户 使 用 组 合 规则 的 预 组 合 模 型 。 

2) 编辑 子 系统 : 辅助 用 户 选 用 预制 构件 模块 ， 装 入 领域 知识 和 控制 信息 ， 建 造 知 
识 库 。 

3) 解释 子 系统 : 执行 用 户 的 程序 ， 进 行 知 识 推理 以 求解 问题 ， 并 提供 查 错 手段 ， 建 造 
推理 机 。 

4) 跟踪 子 系统 : 为 用 户 开发 的 专家 系统 的 运行 进行 全 面 的 跟踪 和 测试 。 

TEIRESIAS 系统 能 帮助 知识 工程 师 把 一 个 领域 专家 的 知识 植 人 知识 库 ， 是 一 个 典型 的 知 
识 获 取 工 具 ， 它 利用 元 知识 来 进行 知识 获取 和 管理 。 
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TEIRESIAS 系统 具有 下 列 功 能 : 

1) 知识 获取 : TEIRESIAS 能 理解 专家 以 特定 的 非 口语 化 的 自然 语言 表达 的 领域 知识 。 

2) 知识 库 调试 : 它 能 帮助 用 户 发 现 知识 库 的 缺陷 、 提 出 修改 建议 ， 用 户 不 必 了 人 解 知识 
库 的 细节 就 可 方便 地 调试 知识 库 。 

3) 推理 指导 : 它 能 利用 元 知识 对 系统 的 推理 进行 指导 。 

4) 系统 维护 : 它 可 帮助 专家 查找 系统 诊断 错误 的 原因 ， 并 在 专家 指导 下 进行 修正 

















5) 运行 监控 : 能 对 系统 的 运行 状态 和 诊断 推理 过 程 进行 监控 。 
4. 6.4 支撑 环境 


专家 系统 支持 环境 (Expert System Support Environment) 是 指 帮 助 进行 程序 设计 的 工具 ， 
它 常 被 作为 知识 工程 语言 的 一 部 分 。 工 具 支 撑 环 境 仅 是 一 个 附带 的 软件 包 ， 以 便 使 用 户 界面 
更 友好 ， 它 包括 四 个 典型 组 件 : 调试 辅助 工具 、 输 入 /输出 设施 、 解 释 设 施 和 知识 库 编 辑 器 。 

1. 调试 辅助 工具 

大 多 数 程 序 设 计 语言 和 知识 工程 语言 都 包含 跟踪 设施 和 断 点 程序 包 ， 跟 踪 设 施 使 用 户 能 
跟踪 或 显示 系统 的 操作 ， 通 常 是 列 出 已 激发 的 所 有 规则 的 名 字 或 序号 ,或 显示 所 有 已 调用 的 
子 程序 。 断 点 程序 包 使 用 户 能 预先 告知 程序 在 什么 位 置 停止 ， 这 样 用 户 能 够 在 一 些 重 复发 生 
的 错误 之 前 中 断 程序 ， 并 检查 数据 库 中 的 数据 。 所 有 的 专家 系统 工具 都 应 具有 这 些 基本 
功能 。 

2. 输入 /输出 设施 

输入 /输出 设施 在 系统 运行 时 可 通过 人 机 对 话 获取 有 关 信 息 。 传 统 的 选单 方式 缺乏 智能 
性 。 一 般 专 家 系统 需 用 智能 询问 的 方式 ， 即 在 运行 过 程 中 由 系统 主动 地 、 有 针对 性 地 提出 问 
题 或 做 出 解释 。 这 种 提问 或 解释 可 以 是 简单 的 是 、 否 、 不 知道 等 ， 也 可 以 用 一 定 范围 内 的 受 
限 自 然 语言 的 文字 或 声音 方式 对 话 ， 或 者 用 图 形 、 图 像 方式 显示 ， 目 标 是 使 人 机 对 话 方式 更 
自然 、 更 方便 、 更 能 理解 、 更 具 智 能 性 。 良 好 的 输入 /输出 能 力 将 带 给 用 户 一 个 方便 友善 的 
界面 。 

例如 EMYCIN 能 在 运行 时 向 用 户 索 要 它 所 需要 而 知识 库 中 没有 的 信息 ，EXPERT 不 仅 能 
询问 这 类 信息 ， 而 且 在 请 求 输入 信息 时 能 提供 菜单 供用 户 选 择 。 男 外 ， 在 系统 运行 中 ， 它 们 
也 允许 用 户主 动 输入 一 些 信息 。 

3. 解释 设施 

虽然 所 有 的 专家 系统 都 具有 向 用 户 解 释 结 论 和 推理 过 程 的 能 力 ， 但 它们 并 非 都 能 提供 同 
一 水 平 的 解释 软件 支撑 。 一 些 专 家 系统 工具 ， 如 EMYCIN， 内 部 具有 一 个 完整 的 解释 机 制 ， 
因而 用 EMYCIN 写 的 专家 系统 能 自动 地 使 用 这 个 机 制 。 而 一 些 没有 提供 内 部 解释 机 制 的 工 
有 具 ， 知 识 工程 师 在 使 用 它们 构造 专家 系统 时 就 得 另外 编写 解释 程序 。 解 释 机 制 常 采 用 回溯 推 
理 , 应 具有 以 下 的 能 

1) 解释 系统 是 如 何 到 达 一 个 特定 状态 的 。 

2) 能 处 理 假设 推理 ， 即 系统 能 解释 如 果 某 一 事实 或 规则 略 有 不 同 将 会 推出 什么 结论 。 

3) 能 处 理 反 事 实 推理 ， 即 系统 能 解释 为 什么 未 得 到 一 个 期 望 的 结论 。 
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4. 知识 库 编辑 器 

是 为 用 户 或 知识 工程 师 提 供 的 一 种 修改 知识 库 的 工具 ， 包 括 专家 系统 在 调试 和 运行 过 程 
中 ， 需 要 提供 对 知识 库 进行 增 、 删 、 改 的 手段 和 记录 有 关 修 改 与 被 修改 的 知识 信息 ; 常用 的 
语法 检查 工具 ， 用 以 解释 和 纠正 语法 错误 的 规则 ; 还 有 ， 用 以 检查 输入 规则 的 语义 ， 去 发 现 
它们 是 否 同系 统 中 已 有 的 知识 发 生 冲突 的 检查 工具 ， 当 发 生 冲 突 时 ， 编 辑 程 序 就 要 解释 什么 
引起 了 冲突 。 为 此 ， 要 求 编辑 程序 必须 理解 规则 和 各 种 事实 的 含义 。 























4.7 ” Prolog 语言 


4.7. 1 Prolog 语言 的 特点 


Prolog 是 英文 PROgramming in LOGic 的 缩写 ， 是 最 有 影响 的 人 工 智能 语言 之 一 。 由 于 该 
语言 很 适合 表达 人 的 思维 和 推理 规则 ， 在 自然 语言 理解 、 机 需 定 理 证 明 、 专 家 系统 等 方面 得 
到 了 广泛 的 应 用 ， 已 经 成 为 人 工 智能 应 用 领域 强 有 力 的 开发 语言 。 

Prolog 是 一 种 说 明 性 语言 ， 其 理论 基础 是 一 阶 谓词 逻辑 。 使 用 Prolog 能 够 比 其 他 的 语言 
更 快速 地 开发 程序 ， 我 们 只 需要 告诉 它 做 什么 ， 而 不 必 告诉 它 怎 么 做 ， 在 运用 Prolog 进行 程 
序 设计 时 ,重点 在 于 对 那些 与 问题 有 关 对 象 间 的 逻辑 描述 ， 在 这 种 逻辑 描述 的 基础 上 ， 
Prolog 运用 自身 具有 的 问题 求解 机 制 解 决 问题 。 

Prolog 语言 最 早 是 由 法 国 马赛 大 学 的 Colmerauer 和 他 的 研究 小 组 于 1972 年 研制 成 功 的 。 
早期 的 Prolog 版 本 都 是 解释 型 的 ， 自 1986 年 美国 Borland 公司 推出 编译 型 Prolog， 即 Turbo 
Prolog 以 后 ，Prolog 便 很 快 在 PC 上 流行 起 来 。 后 来 又 经 历 了 PDC Prolog 、Visual Prolog 等 不 
同 版 本 的 发 展 。 

1. TurboProlog 与 PDC Prolog 

由 美国 Prolog 开发 中 心 (Prolog Development Center，PDC) 开发 ， 其 1.0、2.0、2.1 版 
本 取 名 为 Turbo Prolog， 主 要 在 IBM PC 系列 计算 机 ，MS-DOS 环境 下 运行 。1990 年 后 ，PDC 
推出 新 的 版 本 ， 更 名 为 PDC Prolog 3. 0、3. 2， 它 把 运行 环境 扩展 到 0S/2 操作 系统 ， 并 且 向 
全 世界 发 行 。Turbo Prolog 与 PDC Prolog 具有 速度 快 ， 功 能 强 ， 拥 有 集成 化 开发 环境 ， 可 同 
其 他 语言 接口 ， 能 实现 动态 数据 库 和 大 型 外 部 数据 库 ， 可 直接 访问 机 器 系统 硬件 、 图 形 、 窗 
口 等 特点 。 

2. VisualProlog 

VisualProlog 是 基于 Prolog 语言 的 可 视 化 集成 开发 环境 ， 是 PDC 推出 的 基于 Windows 环 
境 的 智能 化 编程 工具 。 目 前 ，Visual Prolog 在 美国 、 西 欧 、 日 本 、 加 拿 大 、 澳 大 利 亚 等 国家 
和 地 区 十 分 流行 ， 是 国际 上 研究 和 开发 智能 化 应 用 的 主流 工具 之 一 。 

VisualProlog 具有 模式 匹配 、 递 归 、 回 滴 、 对 象 机 制 、 事 实数 据 库 和 谓词 库 等 强大 功能 。 
它 包含 构建 大 型 应 用 程序 所 需要 的 一 切 特性 ， 图 形 开 发 环境 、 编 译 器 、 连 接 器 和 调试 器 ， 文 
持 模块 化 和 面向 对 象 程序 设计 ， 支 持 系 统 级 编程 、 文 件 操作 、 字 符 串 处 理 、 位 级 运算 、 算 术 
与 逻辑 运算 ， 以 及 与 其 他 编程 语言 的 接口 。 

VisualProlog 包含 一 个 全 部 使 用 Visual Prolog 语言 写成 的 有 效 的 开发 环境 ， 包 含 对 话 框 、 
菜单 、 工 具 栏 等 编辑 功能 。 
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虽然 Prolog 有 许多 版 本 ， 不 同 版 本 所 包含 的 内 容 以 及 书写 程序 的 格式 要 求 会 有 所 不 同 ， 
但 其 核心 部 分 是 一 致 的 ， 核 心 部 分 称 为 基本 Prolog。 


4.7.2 基本 Prolog 的 程序 结构 


Prolog 语言 结构 十 分 简单 ， 只 有 三 种 语句 结构 ， 分 别称 为 事实 、 规 则 和 问题 。 

1. 事实 (fact) 

格式 : 谓词 名 [ (< 项 表 >)]. 

其 中 谓词 名 是 以 小 写 英 文字 母 打 头 的 字母 、 数 字 、 下 划 线 等 组 成 的 字符 串 。 项 表 是 用 到 
号 隔 开 的 多 个 项 。 项 可 以 是 常量 或 变量 表示 的 简单 对 象 以 及 函数 、 结 构 和 表 等 复合 对 象 ， 即 
事实 的 形式 是 一 个 原子 谓词 公式 。 项 表 中 出 现 的 变量 应 以 大 写字 母 开 头 ， 谓 词 名 应 以 小 写字 
母 开 头 。 事 实 的 最 后 要 用 实心 的 句点 “. ”结束 。 

功能 : 一 般 表示 对 象 的 属性 、 状 态 或 多 个 对 象 间 的 关系 等 。 

例如 : 

student(" 张 三 " ) . 

likes(" 李 四 " ," 音乐 " ). 

就 是 Prolog 中 的 两 个 合法 事实 。 分 别 表 示 “ 张 三 是 学 生 ” 和 “ 李 四 喜 欢 音乐 ”。 

作为 特殊 情形 ， 一 个 事实 也 可 以 只 有 谓词 名 。 

例如 . 


abc. 





























repeat. 
2. 规则 (rule) 
格式 : 谓词 名 [ (< 项 表 >) ] :- 谓 词 名 [ (< 项 表 >) ] | ,谓词 名 [ (< 项 表 >) ] |. 
其 中 “: -” 号 表示 “if”， 其 左 部 的 谓词 是 规则 的 结论 〈 也 称 为 规则 头 ) ， 右 部 的 谓词 
是 规则 的 前 提 〈 亦 称 为 规则 体 ) ，[ ] 表示 其 中 的 内 容 是 可 选 的 ，| | 表示 其 中 内 容 可 零 次 
或 多 次 重复 ， 逗 号 表示 and (逻辑 与 )， 即 规则 的 形式 是 一 个 逻辑 蕴含 式 。 规 则 的 最 后 要 用 
实心 的 句点 “. ”结束 。 
功能 : 一 般 表示 对 象 间 的 因果 关系 、 殖 含 关 系 或 对 应 关系 。 
例如 : friend(" 赵 六 " ,X) :-likes(X," 阅 读 " ) ,likes(X," 音 乐 " ). 
表示 “如 果 X 爱好 阅读 ， 并 且 X 爱好 音乐 , 则 X 是 赵 六 的 朋友 ”。 
再 比如 : grandfather(X,Y) :=-father(X,Z) ,father(Z,Y). 表示 “如 果 X 是 2Z 的 父亲 并 且 Z 
又 是 Y 的 父亲 , 则 X 是 YY 的 祖父 ”。 
作为 特殊 情形 ， 规 则 中 的 谓词 也 可 以 只 有 谓词 名 而 无 参量 。 
例如 : 
run:—path(a,X) ,write(" 双 =" ,X) ,nl ,fail. 
3. 问题 (question ) 
格式 :? -谓词 名 [ (< 项 表 >) ] | ,谓词 名 [ (< 项 表 >) ] |. 
功能 : 表示 用 户 的 询问 ， 即 程序 运行 的 目标 。 
例如 : 
? -student(" 张 三 " ). 
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表示 “ 张 三 是 学 生 吗 ?”。 

Prolog 程序 中 的 问题 也 被 称 作 目 标 ， 目 标 可 以 由 一 个 谓词 构成 也 可 以 由 多 个 谓词 构成 。 
如 果 目 标 由 多 个 谓词 构成 ， 则 多 个 谓词 间 由 逗号 隔 开 ， 每 个 谓词 都 被 称 作 一 个 子 目 标 。 问 题 
的 最 后 可 用 实心 的 句点 “. ”结束 (有 些 版 本 不 要 求 ) ， 问 题 的 格式 在 Prolog 不 同 版 本 中 也 
稍 有 不 同 。 

总 之 ，Prolog 程序 一 般 由 一 组 事实 、 规 则 和 问题 组 成 。“ 问题” 是 程序 执行 的 起 点 。 

【 例 4-1] 

likes(" 张 三 " ," 运 动 

likes(" 李 四 " ," 音乐 " 

likes(" 李 四 " ," 运 动 

likes(" 王 五 ", "旅游 " ). 

friend(" 赵 六 " ,X) :=-likes(X," 阅读 " ) ,likes(X," 
friend(" 赵 六 " ,X) :=-likes(X," 运动 " ) ,likes(X," 

? -friend(" 赵 六 " ,Y). 

本 例 中 前 四 名 是 四 个 事实 ， 第 五 、 六 句 是 两 条 规则 ， 第 七 句 是 问题 (目标 )。 本 例 中 的 
问题 也 可 以 是 : 

? -likes(" 张 三 " ,X). 

或 

? -likes(" 李 四 " ," 音 乐 " ). 

或 

? -friend(X,Y). 

或 

? -likes(" 李 四 " , "运动 " ) ,likes(" 张 三 " , "音乐 " ) ,friend(" 赵 六 " ,X). 

对 于 不 同 的 问题 ,程序 运行 的 结果 一 般 是 不 一 样 的 。 








音乐 " ). 
音乐 " ). 


4. 7. 3 Prolog 程序 的 运行 机 理 


Prolog 程序 的 运行 是 从 目标 出 发 ， 并 不 断 进 行 匹配 合 一 、 归 结 ， 有 时 还 要 回溯 ， 直 到 目 
标 被 完全 满足 或 不 能 满足 时 为 止 。 下 面 引入 几 个 概念 。 

自由 变量 与 约束 变量 : Prolog 中 称 无 值 的 变量 为 自由 变量 ， 有 值 的 变量 为 约束 变量 。 一 
个 变量 取 了 某 值 就 说 该 变量 约束 于 某 值 ， 或 者 说 该 变量 被 某 值 所 约束 ,或 者 说 该 变量 被 某 值 
实例 化 了 。 在 程序 运行 期 间 ,， 一 个 自由 变量 可 以 被 实例 化 而 成 为 约束 变量 ， 反 之 ， 一 个 约束 
变量 也 可 被 解除 其 值 而 成 为 自由 变量 。 

匹配 合 一 :两 个 谓词 可 匹配 合 一 ， 是 指 两 个 谓词 的 谓词 名 相同 ， 项 的 个 数 相 同 ， 参 量 类 
型 对 应 相同 ， 并 且 对 应 参量 项 还 满足 下 列 条 件 之 一 : 

1) 如 果 两 个 都 是 常量 ， 则 必须 完全 相同 。 

2) 如 果 两 个 都 是 约束 变量 ， 则 两 个 约束 值 必须 相同 。 

3) 如 果 其 中 一 个 是 常量 ,一 个 是 约束 变量 ， 则 约束 值 与 常量 必须 相同 。 

4) 至 少 有 一 个 是 自由 变量 。 
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【 例 4-2】 

prel( "obl" ,"ob2" ,2). 

prel("obl" ,X,Y). 

只 有 当 变 量 X 被 约束 为 “ob2”， 日 X,Y 的 约束 值 相同 或 者 至 少 有 一 个 是 自由 变量 时 ， 
它们 才 是 匹配 合 一 的 。 

PROLOG 的 匹配 合 一 与 归结 原理 中 的 合 一 十 分 类 似 ， 但 这 里 的 合 一 同时 也 是 一 种 操作 。 
这 种 操作 可 使 自由 变量 与 常量 之 间 、 两 个 自由 变量 之 间 建 立 一 种 对 应 关系 ， 使 得 常量 作为 对 
应 变量 的 约束 值 ， 或 两 个 对 应 的 自由 变量 始终 保持 一 致 ， 即 者 其 中 一 个 被 某 值 约 束 ， 则 另 一 
个 也 被 同一 值 约束 ; 反之 ， 若 其 中 一 个 的 值 被 解除 ， 则 另 一 个 的 值 也 被 解除 。 

合 一 操作 是 Prolog 的 一 个 特有 机 制 。 

回溯 : 对 于 多 个 子 目标 的 情况 ， 当 某 一 个 子 目 标 找 不 到 能 与 之 匹配 合 一 的 谓词 时 ， 如 果 
该 子 目标 前 面 存在 一 个 已 经 满足 的 子 目 标 ， 则 撤销 已 经 满足 的 子 目 标 有 关 变 量 的 约束 值 ， 使 
其 重新 满足 。 成 功 后 ， 再 继续 满足 原子 目标 。 如 果 失 败 的 子 目标 前 再 无 子 目标 ， 则 控制 就 返 
回 到 该 子 目标 的 上 一 级 目标 ( 即 该 子 目 标 谓 词 所 在 规则 的 头 部 ) 使 它 重新 匹配 。 

回溯 也 是 Prolog 的 一 个 重要 机 制 。 

下 面 ， 我 们 通过 例 4-2 给 出 的 程序 分 析 其 运行 过 程 ， 以 说 明 Prolog 的 运行 机 理 。 
































likes(" 张 三 " , "运动" ). (1) 
likes(" 李 四 " ， "音乐 " ). (2) 
likes(" 李 四 " ," 运动" ). (3) 
likes(" 王 五 " ," 旅游" ). (4) 


friend(" 赵 六 " ,X) :likes(X," 阅读" ) ,likes(X, "音乐 " ). (5) 

friend(" 赵 六 " ,X) :-likes(X, "运动 " ) ,likes(X, "音乐 " ). (6) 

? -friend(" 赵 六 " ,了 Y) . 

本 例 的 目标 是 求 赵 六 的 朋友 是 谁 。 这 时 ， 系 统 对 程序 进行 扫描 ， 寻 找 能 与 friend(" 赵 
六 " ,Y) 匹配 合 一 的 事实 或 规则 头 部 。 显 然 ， 程 序 中 前 面 的 四 条 事实 均 不 能 与 目标 匹配 ， 而 
第 五 个 语句 的 左 端 ， 即 规则 的 头 部 可 与 目标 谓词 匹配 合 一 。 但 由 于 这 个 语句 又 是 一 个 规则 ， 
所 以 其 结论 要 成 立 则 必须 其 前 提 全 部 都 成 立 。 于 是 ， 对 原 目 标的 求解 就 转化 为 对 新 目标 

likes(X, "阅读 " ) ,likes(X, "音乐 " ). 的 求解 。 

这 实际 是 经 归结 ， 规 则 头 部 被 消去 ， 而 目标 子 句 变 为 

? -likes(X, "阅读 " ) ,likes(X, "音乐 " ). 

现在 依次 对 子 目标 likes (X," 阅读 ") 和 jlikes (X," 音乐 ") 求解 ， 如 果 能 够 找到 同时 
满足 这 两 个 子 目标 的 X 值 ， 则 由 匹配 合 一 的 概念 可 知 ， 此 时 的 X 取 值 就 是 Y 的 值 ， 即 问题 
的 答案 。 

子 目 标的 求解 过 程 ， 与 主 目标 完全 一 样 ， 也 是 从 头 对 程序 进行 扫描 ， 不 断 进 行 测 试 和 匹 
配合 一 等 ， 直 到 匹配 成 功 或 扫描 完整 个 程序 为 止 。 

可 以 看 出 ， 对 第 一 个 子 目标 likes (X," 阅 读 " ) 的 求解 因 无 可 匹配 的 事实 和 规则 而 立即 
失败 ， 进 而 导致 规则 Friend (" 赵 六 "，X) : -likes (X," 阅读" ) ，likes (X," 音乐 ") 的 整 
体 失败 。 于 是 ， 刚 才 的 子 目 标 likes (X," 阅读" ) 和 likes (X," 音 乐 ") 被 撤销 ， 系 统 又 回 
测 到 原 目标 friend (" 赵 六 " ，X) 。 
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这 时 ， We ( 即 第 五 句 ) 向 下 继续 扫描 程序 中 的 子 句 ， 试 
图 重新 使 原 目 标 匹 配 ， 结果 发 现 第 六 条 语句 的 左 部 ， 即 规则 : 

friend(" 赵 六 " ,X) :=-likes(X," 运动" ) ，likes (X," 音 乐 ") . 

的 头 部 可 与 目标 为 亩 词 匹配 。 但 由 于 这 个 语句 又 是 一 个 规则 ， 于 是 ， 这 时 对 原 目标 的 求解 ， 
就 又 转化 为 依次 对 子 目 标 : 

likes(X, "运动 " ) 和 likes(X, "音乐 " ). 的 求解 。 

ee (X, " 运动 " ) 与 程序 中 的 事实 立即 匹配 成 功 ， 且 变量 X 被 约束 为 
“ 张 三 ”， ， 系 统 便 接着 求解 第 二 个 子 目标 。 由 于 变量 X 已 被 约束 ， 所 以 这 时 第 二 个 子 
0 (" 张 三 " ," 音 乐 " ). 。 

由 于 程序 中 不 存在 事实 likes (" 张 三 "," 音 乐 ")， 所 以 该 目标 的 求解 失败 。 于 是 ， 系 统 
就 放弃 这 个 子 目标 ， 并 使 变量 X 恢复 为 自由 变量 ， 然 后 回溯 到 第 一 个 子 目 标 ， 重 新 对 它 进 
行 求解 。 由 于 系统 已 经 记 住 了 刚才 已 同 第 一 子 目 标 谓 词 匹 配 过 的 事实 的 位 置 ， 所 以 重新 求解 
时 , 便 从 下 一 个 事实 开始 测试 。 易 见 ， 当 测试 到 程序 中 第 三 个 事实 时 ， 第 一 个 子 目 标 便 求解 
成 功 ， 量 变量 X 被 约束 为 “ 李 四 ”。 这 样 ， 第 二 个 子 目 标 也 就 变 成 了 : 

likes(" 李 四 " ," 音 乐 " ). 

再 对 它 进行 求解 。 这 次 很 快 成 功 。 

由 于 两 个 子 目 标 都 求解 成 功 ， 所 以 ， i friend(" 赵 六 " ,Y) 也 成 功 ， 且 变量 Y 被 约 
束 为 ” 李 四 "”( 由 了 与 X 的 合 一 关系 )。 于 是 ， 系 统 回 答 : Y="” 李 四 " ， 程 序 运行 结 

上 面 只 给 出 了 问题 的 一 个 解 。 如 果 需 要 和 可 能 的 话 ， 系 统 还 可 把 “ 赵 六 ”的 所 有 朋友 
都 找 出 来 。 

上 述 程序 的 运行 是 一 个 通过 推理 实现 的 求 值 过 程 。 我 们 也 可 以 使 它 变 为 证 明 过 程 。 例 
如 ， 把 上 述 程序 中 的 询问 改 为 : friend(" 赵 六 " ," 李 四" ) ， 则 系统 会 回答 : yes; 知 将 询问 改 
为 : friend(" 赵 六 " ," 王 五 ") ， 则 系统 会 回答 : No solutions。 


4.7.4 Turbo Prolog 程序 结构 


一 个 完整 的 Turbo Prolog 程序 包括 常量 段 、 领 域 段 、 数 据 库 段 、 谓 词 段 、 目 标 段 和 子 名 
段 等 六 个 部 分 及 指示 编译 程序 执行 特定 任务 的 编译 指令 
/*< 注 释 >*/ 
< 编译 指令 > 
constants 
< 常量 说 明 > 
domains 
< 域 说 明 > 
database 
< 数据 库 说 明 > 
predicates 
< 谓词 说 明 > 
goal 
< 目标 语句 > 
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clauses 
< 子 句 集 > 

一 个 Turbo Prolog 程序 不 一 定 要 包括 上 述 所 有 段 ， 但 一 个 程序 至 少 要 有 predicates 段 和 
clauses 段 。 

领域 段 (domains) 用 于 说 明 程 序 谓词 中 所 有 参量 的 领域 。 领 域 的 说 明 可 能 会 出 现 多 层 
说 明 ， 直 到 最 终 说 明 到 Turbo Prolog 的 标准 领域 为 止 。Turbo Prolog 的 标准 领域 即 标准 数据 类 
型 , 包括 整数 (integer)、 实 数 (real)、 字 符 (char)、 子 符 串 (string) 和 符号 
(symbol) 等 。 

谓词 段 (predicates ) 用 于 说 明 程序 中 用 到 的 谓词 名 和 谓词 参量 项 所 属 领域 。 

子 句 段 (clauses ) 用 于 存放 所 有 事实 和 规则 。 

目标 段 (goal ) 用 于 存放 程序 目标 ; 目标 段 可 以 只 有 一 个 目标 谓词 ， 也 可 以 有 多 个 目 
标 谓词 。 


存放 在 目标 段 中 的 目标 ， 称 为 内 部 目标 ; 在 程序 运行 时 临时 给 出 目标 ， 称 为 外 部 目标 。 
4.7.5 Turbo Prolog 的 数据 与 表达 式 


1. 领域 

Turbo Prolog 谓词 中 各 个 项 的 取 值 范围 被 称 作 领域 。Turbo Prolog 包括 整数 (integer)、 
实数 (real) 、 字 符 (char) 、 字 符 串 (string) 和 符号 (symbol) 等 五 种 标准 领域 , 还 有 结 
构 、 表 和 文件 等 三 种 复合 域 。 

结构 也 称 复合 对 象 ， 它 是 Turbo Prolog 谓词 中 的 一 种 特殊 的 项 。 结 构 的 一 般 形式 为 : 

函数 名 〈《 人 参量 表 》 ) 

复合 对 象 可 表达 树 形 数据 结构 。 

例如 : likes (tom，sports (football, basketball, table_ tennis) ) . 

其 中 sports (football ，basketball ，table_ tennis) 就 是 一 个 结构 ， 即 复合 对 象 。 复 合 对 象 
在 程序 中 的 说 明 ， 需 分 层 进行 ， 直 至 标准 领域 : 














domains 
name = symbol /* symbol 为 标准 领域 * / 
sy= symbol /* symbol 为 标准 领域 * / 
sp=sports( sy,sy ,sy ) 

predicates 


likes( name ,sp) 
domains 
sp=sports( symbol, symbol, symbol) 
predicates 
likes( symbol, sp) 
表 的 一 般 形式 是 ;[ x ,xs,… ,x, ] 
其 中 x(i=1,2,3…n) 为 Prolog 的 项 ,一 般 要 求 同 一 个 表 的 元 素 属于 同一 领域 。 不 含 任何 
元 素 的 表 称 为 空 表 , 记 为 [ ] 。 
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例 : 

[1,2,3] 

| apple ,orange ,banana , grape , cane | 

[ 

表 的 最 大 特点 是 其 元 素 个 数 可 在 程序 运行 期 间 动 态 变 化 。 表 的 元 素 也 可 以 是 结构 或 表 ， 
在 这 种 情况 下 其 元 素 可 以 属于 不 同 领域 。 

表 的 说 明 方 法 是 在 其 组 成 元 素 的 说 明 符 后 加 一 个 星 号 * 。 

例如 : 


domains 











lists = string * 
predicates 
pl( lists) 
说 明 谓 词 pl 中 的 项 lists 是 一 个 由 串 string 组 成 的 表 。 
2. 常量 与 变量 
Turbo Prolog 的 常量 和 变量 有 整数 、 实 数 、 字 符 、 串 、 符 号 、 结 构 、 表 和 文件 这 八 种 数 
据 类 型 。 变 量 名 由 大 写字 母 开头 的 字母 、 数 字 和 下 划 线 序列 构成 ， 或 者 只 有 一 个 下 划 线 。 只 
有 一 个 下 划 线 的 变量 称 为 无 名 变量 。 
3. 算术 表达 式 
Turbo Prolog 提供 了 五 种 最 基本 的 算术 运算 : 加 、 减 、 乘 、 除 和 取 模 ， 相 应 运算 符号 为 
+、-、*、/、mod， 这 五 种 运算 的 顺序 为 : * 、/、mod 为 同一 级 , +、- 为 同一 级 ， 前 者 优 
先 于 后 者 。 同 级 从 左 到 右 按 顺序 运算 ， 括 号 优先 。 
算术 表达 式 的 形式 与 数学 中 的 形式 基本 一 样 。 
例如 . 
X+Y*Z 
A*B-C/D 
U mod V 
即 是 说 ，Turbo Prolog 中 算术 表达 式 采 用 通常 数学 中 使 用 的 中 缀 形式 。 这 种 算术 表达 式 
为 Prolog 的 一 种 异体 结构 。Prolog 提供 了 若干 内 部 谓词 ， 来 实现 算术 运算 、 输 入 /输出 等 
操作 。 
内 部 谓词 不 是 由 编程 者 自己 定义 的 ， 而 是 由 Prolog 系统 预先 提供 的 谓词 。 编 程 时 可 以 不 
加 定义 地 直接 利用 这 些 谓词 ， 因 而 为 程序 设计 提供 了 便利 。 内 部 谓词 由 系统 实现 ， 因 此 他 们 
的 执行 效率 很 高 。 
4. 关系 表达 式 
Turbo Prolog 提供 了 六 种 常用 的 关系 运算 : <，<=，=，>，>=，<> 
Turbo Prolog 的 关系 表达 式 例子 : 
X+1>=Y 
X<>Y 
而 如 果 按 Turbo Prolog 形式 来 表示 ， 则 上 面 的 两 个 例子 为 : >=(X+1,Y) 和 <>(X,Y) 
上 述 六 种 关系 运算 符 ， 实 际 上 是 Turbo Prolog 内 部 定义 好 的 六 个 内 部 谓词 。 
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说 明 :“=” 的 用 法 比较 特殊 ， 它 既 可 以 表示 比较 ， 也 可 以 表示 约束 值 ， 即 使 在 同一 个 
规则 中 的 同一 个 “=“ 也 是 如 此 。 
例如 : 
p(X,Y,Z):-Z=X+Y 
当 变 量 X、Y、2Z 全 部 被 实例 化 时 ,“=” 就 是 比较 符 。 对 于 问题 
goal 
p(3,5,8). 
机 器 回答 : yes 
而 对 于 goal 
p(3,5,7). 
机 器 回答 : no 
但 当 X、YY 被 实例 化 ， 而 Z 未 被 实例 化 时 ,“ =” 就 是 约束 符 。 
goal 
p(3,5,2). 
机 融 回答: Z=8 
这 时 ， 机 器 使 Z 实例 化 为 X+Y 的 结果 。 
5. 输入 与 输出 


1) readln (X) 从 键盘 上 读 取 一 个 字符 串 ， 然 后 约束 给 变量 X。 

2) readint (X) 从 键盘 上 读 取 一 个 整数 ， 然 后 约束 给 变量 X ， 如 果 键 盘 上 打 入 的 不 是 
整数 则 该 谓词 失败 。 

3) readreal (X) 从 键盘 上 读 取 一 个 实数 ， 然 后 约束 给 变量 X， 如 果 键 盘 上 打 和 的 不 是 
实数 则 该 谓词 失败 。 

4) readchar (X) 从 键盘 上 读 取 一 个 字符 ， 然 后 约束 给 变量 X， 如 果 键 盘 上 打 入 的 不 是 
单个 字符 ， 则 该 谓词 失败 。 

5) write (XI ，X,，…X,) 的 功能 是 把 项 Xi 的 值 显 示 在 屏幕 上 或 者 打印 在 纸 上 ， 当 有 
某 个 Xi 未 实例 化 时 ， 该 谓词 失败 ， 其 中 Xi 可 以 是 变量 ， 也 可 以 是 字符 串 或 数字 。 

例如 : write("computer" ," PROLOG" ,了 ,1992 ) 

6) nl 换行 谓词 ， 它 们 后 面 的 输出 另 起 一 行 。 另 外 ， 利 用 write 的 输出 项 " \n" 也 同样 可 
起 换行 的 作用 。 

write( "name" ) ,nl,write("age" ) 

与 write("anme" ,"\n","age" ) 的 效果 完全 一 样 。 

6. 表 处 理 与 递归 

表 是 Prolog 中 一 种 非常 有 用 的 数据 结构 。 表 的 表述 能 力 很 强 ， 数 字 中 的 序列 、 集 合 ,， 通 
常 语言 中 的 数组 、 记 录 等 均 可 用 表 来 表示 。 表 的 最 大 特点 是 其 长 度 不 固定 ， 在 程序 的 运行 过 
程 中 可 动态 地 变化 。 具 体 来 讲 ， 就 是 在 程序 运行 时 ， 可 对 表 实 行 一 些 操 作 ， 如 给 表 中 添加 一 
个 元 素 ， 或 从 中 删除 一 个 元 素 ， 或 者 将 两 个 表 合 并 为 一 个 表 等 。 用 表 还 可 以 方便 地 构造 堆 
栈 、 队 列 、 链 表 、 树 等 动态 数据 结构 。 

表 还 有 一 个 重要 特点 ， 就 是 它 可 以 分 为 头 和 尾 两 部 分 。 表 头 是 表 中 的 第 一 个 元 素 ， 而 表 
尾 是 表 中 的 除 第 一 个 元 素 外 的 其 余 元 素 按 原来 顺序 组 成 的 表 。 
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表 表 头 尾 
[1,2,3,4,5] 1 [2,3,4,5] 

[ apple ,orange , banana | apple [ orange , banana | 
["PROLOG" ] "PROLOG" [ ] 

[ 无 定义 无 定义 


在 程序 中 是 用 竖 线 “| ”来 区 分 表 头 和 表 尾 ， 而 且 还 可 以 使 用 变量 。 例 如 一 般 地 [H 
1 T] 来 表示 一 个 表 ， 其 中 日 、T 都 是 变量 ，H 为 表 头 ，T 为 表 尾 。 表 的 这 种 表示 法 为 表 的 
操作 提供 了 极 大 的 方便 。 














例 : 

表 1 表 2 合 一 后 的 变量 值 

[XIY] [a,b,c] X=a,Y=[b,c] 

[XIY] [al X=a,Y=| |] 

[alY] [X,b] X=a,Y=[b] 

[X,Y,Z] [a,b,c] X=a,Y=b,Z=¢c 

[[a,Y]lZ] [[X,bj,[ej] X=a,Y=b,Z=[[c]j 

还 需 说 明 的 是 ， 表 中 的 竖 杠 “| ”后 面具 能 有 一 个 变量 ， 但 竖 杠 前 面 的 变量 可 以 多 于 
一 个 。 另 外 ， 竖 杠 的 前 面 和 后 面 也 可 以 是 常量 。 如 无 竖 枉 “1 ”， 则 不 能 分 离 出 表 尾 。 例 





如 , 表 [X,Y,Z] 与 [a,b,e] 合 一 后 得 X=a，Y=b，Z=c. 其 中 Z 并非 等 于 [c]。 

7. 回溯 控制 

Prolog 在 搜索 目标 解 的 过 程 中 ， 具 有 回溯 机 制 ， 即 当 某 一 个 子 目 标 不 能 满足 时 ， 就 返回 
到 该 子 目标 的 前 一 个 子 目 标 ， 并 放弃 当前 约束 值 ， 使 它 重新 匹配 合 一 。 

在 实际 问题 中 ， 有 时 却 不 需要 回 湖 ， 例 ; 








uncle(X,Z) :-father(Y,Z) ,brother( X,Y). 


? -uncle(U,tom ). 

为 此 PROLOG 专门 定义 了 一 个 阻止 回溯 的 内 部 谓词 “1”， 称 为 截断 谓词 。 

截断 谓词 语义 : 

1) 若 将 “1!1” 插 在 子 句 体内 作为 一 个 子 目 标 ， 它 总 是 立即 成 功 ; 

2) 若 “!” 位 于 子 句 体 的 最 后 ， 则 它 就 阻止 它 所 在 子 句 的 头 谓词 的 所 有 子 句 的 回溯 访 
问 ， 而 让 回 湖 跳 过 该 头 谓词 ， 去 访问 前 一 个 子 目 标 : 

3) 若 “!” 位 于 其 他 位 置 ， 则 当 其 后 发 生 回溯 上 且 回 溯 到 “1!” 处 时 ， 就 在 此 处 失败 ， 并 
且 “!” 还 使 它 所 在 的 子 名 的 头 谓词 整个 失败 ， 即 迫使 系统 直接 回溯 到 该 头 谓 词 的 前 一 个 子 
目标 。 





例 1: 例 2: 
p(a). p(a). 
p(b). p(b). 
q(b). q(b). 


r(X):-p(x),q(X). r(X):-p(x) ,1, q(X). 
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r(c). r(c). 


? —r(Y). 2 /= (YY) 


对 于 例 1 目标 : r (Y) . 可 有 一 个 解 Y=b 





对 于 例 2 目标 : r+ (Y) . 却 无 解 。 








这 是 由 于 例 2 添加 了 截断 谓词 " !" ， 求 解 时 ，X 被 约束 到 a， 


然后 " !" ， 但 在 求解 子 目标 qd (a) 时 遇 到 麻烦 ， 于 是 又 回 漳 


a 


到 "1"， 而 "4" 阻止 了 对 p (X) 的 下 一 个 子 句 p (b) 和 r 的 下 


一 个 定义 子 句 r (c) 的 访问 。 从 而 ， 导 致 整 


攻 个 求解 失败 。 


【 例 4-3】 简单 的 路 径 查 询 程 序 。 程 序 中 的 事实 描述 了 如 。 


图 4-4 所 示 的 有 向 图 ， 规 则 是 图 中 两 节点 间 有 通路 的 定义 。 


Predicates 
road (symbol,symbol) 
path( symbol ,symbol ) 
Clauses 
road(a,b). 
road(a,c). 
road( b,d). 
road(c,d). 
road( d,e). 
road( b,e). 
path( X,Y):-road( X,Y). 





d 
图 4-4 有 向 图 


path( X,Y):-road(X,Z) ,path(Z,Y). 
程序 中 未 含 目标 ， 所 以 运行 时 需 给 出 外 部 目标 。 
例如 当 给 出 目标 : path(a，c). 系统 将 回答 : yes。 
但 当 给 目标 : path(e， a). 时 ， 系统 则 回答 : no 
如 果 给 出 目标 : run . 且 在 程序 中 增加 子 句 : 
run:—path(a,X) ,write(“X=”,X),nl,fail. 


oo pt 
和 
er We 

证 
小 


~ xX x ~ x 和 x 
1 


山 
CC 


X=e 


其 中 fail 是 内 部 谓词 ， 表 示 恒 失败 。 因 此 ， 当 规则 run: -path (a, X), write (“X=” 


X) ,nl,fail. 中 的 第 一 个 子 目标 path (a， 





write 显示 X 的 值 ， 内 部 谓词 nl 回 车 换行 ， 遇 
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X) 得 到 满足 ( 即 找到 一 条 路 径 ) 后 ， 内 部 谓词 





到 恒 失 败 fail 后 ,将 引起 回 滴 ， 直 到 显示 出 所 
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有 路 径 。 而 子 句 run. 用 于 控制 程序 正常 结 
【 例 4-4】 求 阶乘 程序 ， 程 序 中 使 用 了 递归 。 
/* 求 阶乘 程序 * / 


domains 





n,f=integer 
predicates 
factorial(n,f) 
goal 
readint(1) ,factorial (1,F) ,write(l,”! =”,F). 
clauses 
factorial (1,1). 
factorial(N ,Res) :-N>0， 
N1=N-1, 
factorial( N1, FacN1 ) ， 
Res=N * FacN1. 
程序 运行 时 ， 从 键盘 上 输入 一 个 整数 ， 屏 幕 上 将 显示 其 阶乘 数 。 
【 例 4-5】 输出 1 到 10 的 整数 ， 程 序 中 使 用 了 递归 。 


predicates 











count( integer). 
clauses 
count( 11) :-write("That's all folks!" ), !. 
count( Number) :—write( Number) ,nl ,NextNumber = Number + 1 ,count( Nextnumber ) . 
goal 
count( 1). 
本 例 中 ， 由 于 程序 的 目标 是 count(1)， 所 以 程序 开始 运行 时 用 count(1) 调用 这 个 谓 
词 ， 它 会 先 写 出 1， 接 着 加 1 得 到 2， 然 后 它 用 count(2) 调用 自己 ， 写 出 2， 又 加 1， 得 到 
3 ， 直 到 调用 count (11) ， 会 与 规则 count(11) :-write("That's all folks1" ) ，! . 匹配 成 
功 ， 由 于 截断 的 作用 ， 回 渊 停止， 程序 运行 结 
上 述 各 例 可 在 Turbo Prolog 环境 下 正确 运行 ， 由 于 Turbo Prolog 环境 相对 比较 容易 掌握 ， 
本 书 不 予 介绍 。 


4.7.6 Visual Prolog 介绍 


前 面 讲述 了 Turbo Prolog 程序 结构 及 编程 思想 ， 由 于 Visual Prolog (缩写 为 VIP) 是 基 
于 图 形 用 户 界 面 (CUI) 、 面 向 对 象 的 程序 设计 (O00P) 语言 ,程序 的 运行 环境 为 
MsWindows ， 因 此 Visual Prolog 较 之 Turbo Prolog 又 有 了 较 大 扩充 ， 编 写 Visual Prolog 程序 比 
编写 Turbo Prolog 程序 所 需要 的 知识 也 更 多 ， 编 程 也 更 为 复杂 。 而 Visual Prolog 为 我 们 提供 
的 集成 开发 环境 (IDE) 可 以 使 我 们 编写 Visual Prolog 程序 变 得 容易 。 

下 面 通过 [ 例 4-5] 中 输出 1 到 10 的 整数 这 个 问题 在 Visual Prolog 的 实现 过 程 来 初步 认 
识 一 下 Visual Prolog。 由 于 本 课程 主要 注重 Prolog 本 身 ， 而 不 是 图 形 用 户 界面 (GUI)， 
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此 ,这 里 的 输出 方式 使 用 的 是 控制 人 台 输 出 ， 且 并 未 涉及 面 铝 对 象 程 序 设计 的 深层 次 的 内 容 。 
进入 Visual Prolog7.2， 将 打开 Visual Prolog 集成 开发 环境 (IDE) ， 如 图 4-5 所 示 。 





标题 栏 EU 7 Personal Eation nreerstered 


Insert Project Baild Debug Go to Tools Web Window Help 


所 加 加 下 日 心 


“Tisymd prolpg 7T- 2 Personal Editipm 








Visual Prolog 
































New Project Dpen Project Browse... 




















图 4-5 ”集成 开发 环境 IDE 


上 述 集成 开发 环境 中 的 标题 栏 、 菜 单 栏 、 工 具 栏 的 作用 我 们 已 经 很 熟悉 了 ， 需 要 说 明 的 
是 “工程 ”这 个 词 。 由 于 一 个 Visual Prolog 程序 包括 很 多 内 容 ， 因 此 每 当 编 写 一 个 Visual 
Prolog 程序 就 需要 建立 一 个 工程 ， 用 来 保存 这 些 内 容 。 

有 两 种 办 法 创建 工程 : 一 是 当 启 动 Visual Prolog 时 ， 点 击 最 近 打 开 过 的 工程 列表 窗口 底 
部 的 New Project 按钮 来 创建 新 工程 。 二 是 在 菜单 栏 上 点 击 Project 菜单 ， 在 下 拉 菜 单 中 点 击 
“New”， 创 建新 工程 。 


当 创 建 一 个 新 的 工程 时 ，IDE 会 打开 一 个 新 的 窗口 用 来 输入 (或 选择 ) 工程 所 需要 的 
一 些 内容 。 


General | Diectores | Buid Dptions | Version Infomation | File Templates | Run Options | 





Proiect Name: a |example_]| 





山 Strategy: Console 





Target Type: Exe 








Base Directory |F:\wprolog 绕 习 \ 








Sub-Directory. lexample_1 











图 4-6 工程 内 容 设置 窗口 


这 些 内 容 包 括 工程 名 (Project Name) 、 用 户 界面 类 型 (UI Strategy) 、 目 标 类 型 (Target 
Type) 、 基 本 目录 (Base Directory ) 、 子 目录 (Sub-Directory) 等 。 


用 户 界 面 类 型 (UI Strategy) 可 以 是 图 形 用 户 界 面 (GUI) 或 控制 台 界 面 (Console) 。 
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目标 类 型 (Target Type) 是 指 IDE 编译 后 要 产生 的 程序 类 型 ， 可 以 是 EXE 文件 或 DLL 
文件 。 

基本 目录 (Base Directory) 是 程序 所 属 的 文件 夹 ， 要 创建 的 程序 所 产生 的 所 有 文件 夹 都 
在 这 个 基本 目录 中 。 

子 目 录 (Sub - Directory) 是 要 存储 程序 的 文件 夹 。 当 输入 工程 名 时 ,该 子 日 录 名 与 工 
程 名 形 同 。 如 果 愿 意 也 可 以 改变 它 。 

本 窗口 中 还 有 Directories 、Build Options 等 其 他 标签 页 ， 这 里 不 再 一 一 介绍 。 

单 击 OK 按钮 ， 出 现 如 图 4-7 所 示 的 工程 树 。 所 谓 工 程 树 ， 是 当前 工程 所 有 文件 的 一 个 
总 览 ， 外 观 类 似 于 Windows 的 资源 管理 器 ， 实 际 上 它 显 示 的 就 是 硬盘 目录 结构 的 一 部 分 。 


exanple TDrj6 FE-Yor0Iog 练 - . 。 辐 回 因 








Lm 和 ProDinMib 
国 main.pack 
example_1.manilest 

















到 4-7 工程 树 

现在 产生 了 一 个 工程 的 框架 ,还 没有 生成 程序 代码 ， 还 需要 应 用 IDE 的 生成 功能 产生 
必要 的 代码 。 在 任务 菜单 中 选 Build 一 Build 项 ， 生 成 代码 后 工程 树 窗 口 增加 了 几 个 文件 ， 如 
图 4-8 所 示 。 








~ exzample 1.prid Erprolog 练 习 Wezaa-- - 回回 四 
百 | example 1 
-lm $IProDi) 
main.cl 
国 main.pack 
轩 main.ph 
国 main.pro 
图 example_1.manifest 

















图 4-8 生成 代码 后 的 工程 树 
在 IDE 的 菜单 栏 中 点 击 File 一 New ini New Package， 弹 出 如 图 4-9 所 示 的 创建 工程 项 目 











的 窗口 。 

按照 图 中 所 示 在 对 话 框 左 侧 选 择 Class， 输 入 类 的 名 字 为 counter， 选 择 一 个 已 经 存在 的 
包 (main. pack) ， 去 掉 creates object 选项 (因为 这 个 类 只 当 一 个 模块 来 用 ) 。 

单 击 Create 按钮 ，IDE 会 打开 counter. cl 和 counter. pro 文件 。 

在 文件 counter. cl 中 输入 谓词 count 的 声明 : Count: (integer Number) procedure . 后 关闭 
counter. cl 所 在 窗口 。counter. cl 文件 内 容 如 下 : 


class counter 





open core 
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[0 Project Ite 了 





国 Package Name: [counter 
Cl 


© New Package 





国 ialog 

国 nterface 
Icon 个 Existing Package |main.pack 

国 Bitmap S 

| Text File In namespace: 


Parent Directory 

















Creates Objects 
的 
翌 











Cancel Help 
图 4-9 创建 counter 类 





predicates 
classInfo : core: :classInfo. 
% @ short Class information predicate. 
% @ detail This predicate represents information predicate of this class. 
% @ end 
Count: (integer Number) procedure . 
end class counter 
在 文件 counter. pro 文件 中 加 上 谓词 count 定义 的 子 句 (如 下 程序 清单 的 倒数 3、4、5 行 )， 
counter. pro 文件 内 容 如 下 : 


/六 米 米 米 米 米 玉米 玉米 玉米 玉米 玉米 玉米 玉米 米 玉米 玉米 玉米 玉米 玉米 玉米 炒米 炒米 
米 米 米 米 米 米 玉米 米 米 米 米 米 米 米 米 米 米 玉米 米 米 米 米 
Copyright (c) 2010 Unregistered 
米 米 米 米 米 米 米 米 米 米 玉米 玉米 玉米 玉米 玉米 玉米 玉米 玉米 炒米 玉米 炒米 玉米 米 米 米 米 
米 米 米 米 米 米 玉米 米 米 六 玉米 玉米 玉米 炒米 炒米 米 米 炒米 米 / 
implement counter 
open core 
constants 
className ="counter". 
classVersion ="". 
clauses 
classInfo( className, classVersion ) . 
count(11):—stdIO.::write("That’s all folks! "), |! 
count( Number) :~—stdIO : :write( Number) ,stdIO : :nl ， 
NextNumber = Number + 1 ,count( NextNumber) . 


end implement 
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counter 程序 中 的 stdI0: : nl 使 每 个 数字 各 占 一 行 。 
由 于 本 程序 使 用 控制 台 (console) 策略 ， 所 以 还 要 在 目标 中 插入 正确 的 代码 。 先 在 任 
务 菜单 中 选 Build 一 Build 项 构造 工程 ， 然 后 在 main. pro 文件 中 找到 下 面 的 子 句 : 
clauses 
run (): - 
console:: init () ， 
succeed () . % place your own code here 
end implement main 
把 它 改 成 ， 
clauses 
run (): - 
console:: init (), 
counter: : count (1), 
X = stdI0:: readChar () . 
end implement main 
再 次 通过 任务 菜单 中 选 Build 一 Build 项 构造 工程 。 
程序 中 子 句 counter: : count(1) 用 于 启动 计数 ， 子 句 _X=stdI0: :readChar( ) 会 使 程序 输 
出 完毕 后 强迫 程序 等 待 ， 直 到 用 户 单 击 回 车 键 。 如 果 没 有 这 个 句子 ， 还 没 等 用 户 看 清 程序 输 
出 的 内 容 ，MsDOS 控制 台 就 会 消失 。 
找到 example_1. exe， 双 击 运行 程序 ， 会 出 现 一 个 MsDOS 窗口 ， 程 序 显 示 计 数 的 情况 。 


4.7.7 PIE: Prolog 的 推理 机 


PIE 是 Visual Prolog 中 的 一 个 例子 ， 在 使 用 之 前 需要 安装 它 。 如 果 还 没有 安装 ， 请 按 下 
面 的 步骤 进行 安装 : 

1) 在 Windows 的 开始 菜单 中 选择 安装 〈Start 一 Visual Prolog7. 2 一 Setup Examples) 。 

2) 启动 VisualProlog。 

3) 可 以 在 安装 的 Examples 文件 夹 中 找到 PIE 工程 ， 在 IDE 中 打开 这 个 工程 并 编译 后 产 
生 pie. exe 文件 。 

找到 pie. exe 文件 双击 ， 打 开 如 图 4-10 所 示 的 推理 机 界面 。 








File Edit Engine Window le 


DD 日 ~“ KODA ? 


Use OnlineHelp to see descriptions ,.. 

To load example files choose File\Consult menu entry ... 
Type your predicate calls here like 

write["Hello world <- Set Caret here and press Enter 


Stack: ‘3892 Heap: 524288 





图 4-10” ”PIE (Prolog 推理 机 ) 界面 
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选择 Pile 一 New， 将 打开 程序 窗口 ， 它 用 于 输入 Prolog 程序 ， 包 括 事实 和 规则 。 在 程序 
和 窗口 中 输入 下 面子 句 : 

likes(" 张 三" ," 运 动 " 
likes(" 李 四 " ," 音 乐 " 
likes(" 李 四 " ," 运 动 " 
likes(" 王 五 " ," 旅 游 " ). 

friend(" 赵 六 " ,X) :=-likes(X," 阅读" ) ,likes(X," 音 乐 " ). 
friend(" 赵 六 " x): -likes(X," 运 动 " ) ,likes(X," 音 乐 " ). 
如 图 4-11 所 示 。 


) 
) 
) 


Modified 六 




















六 : 1ikes (x," "阅读 ,Likesitz "音乐 ") . 
六 ",X) :-1likes {X, "运动 "1 ,Likesixr" 音 乐 ") . 


Use OnlineHelp to see descriptions ... 

To load example files choose File\Consult menu entry .. 

Type your predicate calls here like 

write["Hello world!"']. <- Set Caret here and press Enter 

Reconsulted from: d:\My Documents\Visual Prolog Examples\pie\EXEFILE1.PRO 


< 





Stack: 2436 Heap: 524288 


图 4-11 新 建文 件 后 的 PIE 


在 PIE 主 菜单 中 选择 Engine 一 Reconsult， 将 会 把 文件 装 和 到 推理 机 。 在 对 话 框 中 ， 还 将 
得 到 类 似 如 下 的 信息 : 

Reconsulted from: d:\My Documents\Visual Prolog Examples\pie\EXE\FILE1. PRO 

在 对 话 框 窗口 Dialog 中 空白 行 输入 需要 求解 的 目标 〈 问 题 ) ， 不 能 带 前 级“ ? -”， 如 : 
friend (" 0 X) 。 回 车 ， 在 对 话 框 窗口 将 得 到 











=" 李 四". 
1 Solution 
ee “ 李 四 ”。 你 可 以 继续 输入 其 他 目标 ， 如 friend (X,Y) 
= "' 赵 六 ". 
= 


1 Solution 。 
表示 “起 六 ”和 “ 李 四 ” 是 朋友 。 
PIE 是 经 典 的 Prolog 解释 程序 ， 使 用 它 可 以 学 习 和 理解 Prolog 而 又 不 用 去 考虑 类 、 类 型 
以 及 图 形 界面 等 问题 ， 可 运行 基本 Prolog 程序 。 因 此 PIE 是 一 个 学 习 Prolog 编程 的 很 好 的 练 
习 场 所 。 
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的 动 


习题 


1. 什么 是 专家 系统 ? 专家 系统 与 传统 程序 有 哪些 区 别 ? 
2. 专家 系统 有 哪些 主要 类 型 ? 
3. 理想 专家 系统 有 哪 几 部 分 组 成 ? 


4. 设 某 小 型 动物 

















加 有 老虎 、 金 钱 豹 、 斑 马 、 长 颈 





















































物 识 别 专家 系统 。 其 中 ， 知 识 库 中 的 知识 用 产生 式 规则 来 表示 ， 共 有 如 下 15 条 规则 : 
规则 1: IF 该 动物 有 奶 
THEN 该 动物 是 哺乳 动物 。 
规则 2 : 正 该 动物 有 毛发 
THEN 该 动物 是 哺乳 动物 。 
规则 3 : 正 该 动物 有 羽毛 
THEN 该 动物 是 岛 。 
规则 4: IF 该 动物 会 飞 AND 会 下 蛋 
THEN 该 动物 是 岛 。 
规则 $: IF 该 动物 有 和 爪 AND 有 犬齿 AND 有 眼 盯 前 方 
THEN 该 动物 是 食肉 动物 。 
规则 6 : IF 该 动物 吃 肉 
THEN 该 动物 是 肉食 动物 。 
规则 7 : IF 该 动物 是 哺乳 动物 AND 有 蹄 
THEN 该 动物 是 有 蹄 类 动物 。 
规则 8 : IF 该 动物 是 哺乳 动物 ” AND 嚼 反刍 
THEN 该 动物 是 有 蹄 类 动物 。 
规则 9 : IF 该 动物 是 哺乳 动物 AND 是 食肉 动物 AND 是 黄 褐色 AND 身上 有 黑色 条 纹 
THEN 该 动物 是 虎 。 
规则 10: IF 该 动物 是 哺乳 动物 AND 是 食肉 动物 AND 是 黄 神色 AND 身上 有 了 暗 斑点 
THEN 该 动物 是 金钱 豹 。 
规则 11: 正 该 动物 是 有 蹄 类 动物 AND 有 长 脖子 AND 有 长 腿 AND 身上 有 上 暗 斑点 
THEN 该 动物 是 长 颈 鹿 。 
规则 12 : IF 该 动物 是 有 蹄 类 动物 AND 身上 有 黑色 条 纹 
THEN 该 动物 是 斑马 。 
规则 13: IF 该 动物 是 鸟 ”AND 不 会 飞 ” AND 有 长 腿 AND 长 脖子 AND 是 黑白 二 色 
THEN 该 动物 是 能 鸟 。 
规则 14 :IF 该 动物 是 鸟 AND 不 会 飞 ”AND 会 游泳 ”AND 是 黑白 二 色 
THEN 该 动物 是 企鹅。 
规则 15: IF 该 动物 是 鸟 ”AND 善 飞 
THEN 该 动物 是 信天翁 。 
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让、 能 鸟 、 企 禾 、 信 天 翁 7 种 动物 ， 试 编写 一 个 小 型 
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模糊 理论 及 应 用 


人 类 的 语言 非常 丰富 ， 语 言 是 人 类 相互 沟通 的 主要 渠道 。 经 典 集合 是 非常 好 的 ， 因 为 有 
许多 对 象 可 以 被 准确 地 划分 ， 例 如 : 到 今年 9 月 1 日 年 满 6 周 岁 的 儿童 可 以 上 小 学 。 其 中 
“到 今年 9 月 1 日 年 满 6 周岁 的 儿童 ”是 个 经 典 集合 ， 它 清晰 地 给 出 了 儿童 上 小 学 的 年 龄 限 
制 ， 对 于 这 个 集合 ， 所 有 儿童 只 有 属于 或 不 属于 两 种 情况 。 

另 一 方面 ， 在 现实 生活 中 ， 存 在 着 大 量 的 不 能 精确 定义 的 事物 。 古 希腊 有 一 个 著名 的 秀 
头 迟 论 ， 它 产生 的 关键 在 于 秃 与 不 秃 是 不 能 用 精确 的 语言 加 以 定义 的 。 我 们 也 看 到 ,在 日 常 
语言 中 ， 经 常会 用 到 一 些 概念 模糊 的 词汇 ， 但 人 们 听 起 来 却 心领神会 。 比 如 ， 我 们 从 书 上 看 
到 一 个 “榨菜 肉片 粥 ”的 食谱 : 

瘦 肉 洗 净 切片 ， 用 少量 水 、 淀 粉 抓 色 ， 入 沸水 微微 余 溪 后 捞 出 ， 沥 干 水 分 榨菜 洗 净 切 
片 ; 亨 菜 洗 净 切 碎 。 

粳米 淘 洗 净 ， 与 适量 清水 一 同 放 入 锅 中 ， 以 大 火 煮 滚 ， 再 改 小 火 者 至 熟 。 

锅 置 火 上 ， 放 少许 油 烧 热 ， 爆 香 萄 末 和 榨菜 片 ， 加 入 高 汤 者 深 ， 放 入 瘦 肉 片 、 盐 、 味 
精 、 葱 末 、 芹 菜 末 ， 然 后 倒 人 粥 中 ， 以 中 淡 者 沸 ， 拌 匀 即 可 。 

在 食谱 中 ， 黑 体 所 标的 词汇 都 是 非常 含糊 的 描述 ， 没 有 精确 的 概念 ， 然 而 我 们 对 这 样 的 
词汇 却 心 领 神 会 ， 相 信 自 己 依据 这 样 的 荣 谱 能 做 出 一 道 好 荣 。 

上 面 所 提 到 的 边界 划分 不 清 ， 难 以 精确 地 判断 与 推理 的 概念 统称 为 模糊 概念 。 


5.1 模糊 理论 的 产生 与 发 展 


20 世纪 50 年 代 后 ， 计 算 机 技术 开始 发 展 ， 特 别 是 其 计算 速度 与 存储 能 力 的 发 展 更 加 迅 
猛 。 它 不 仅 可 以 解决 复杂 的 数学 问题 ， 还 可 以 参与 控制 复杂 的 系统 ， 然 而 其 判断 与 推理 能 
方面 却 和 常常 不 如 人 脑 。 一 般 来 次， 人 脑 具 有 处 理 模 糊 信 息 的 能 力 ， 善 于 判断 和 处 理 模糊 现 
象 。 但 计算 机 对 模糊 现象 识别 能 力 较 差 。 为 了 提高 计算 机 识别 模糊 现象 的 能 力 ， 就 需要 把 人 
们 常用 的 模糊 概念 设计 成 机 器 能 接受 的 指令 和 程序 ， 以 便 机 器 能 像 人 脑 那 样 简 洁 灵 活 地 做 出 
相应 的 判断 ， 从 而 提高 自动 识别 和 控制 模糊 现象 的 效率 。 为 此 ， 需 要 寻找 一 种 描述 和 加 工 模 
糊 信 息 的 数学 工具 ， 这 就 推动 了 数学 家 深入 研究 模糊 数学 。 所 以 ， 模 糊 数 学 的 产生 是 有 其 科 
学 技术 与 数学 发 展 的 必然 性 。 

1965 年 ， 美 国 加 利 福 尼 亚 大 学 的 著名 教授 查 德 (L.A. Zadeh) 在 他 的 《Fuzzy Sets》 和 
《Fuzzy Algorithm》 等 论著 中 提出 了 模糊 集合 与 模糊 算法 的 概念 ， 同 时 ， 第 一 次 用 数学 方法 
成 功 描述 了 模糊 概念 ， 宣 告 了 模糊 数学 的 诞生 。 
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模糊 数学 的 诞生 ， 解 决 了 清晰 数值 与 模糊 概念 之 间 的 映射 问题 。 以 模糊 集合 论 为 基础 的 
模糊 数学 ， 为 经 典 数学 与 充满 模糊 的 现实 世界 架 起 了 一 座 桥梁 。 

模糊 数学 产生 后 ， 客 观 事物 的 确定 性 和 不 确定 性 在 量 的 方面 的 表现 ， 可 作 如 下 划分 : 
确定 性 一 一 经 典 数 学 
| 随机 性 一 一 统计 数学 
模糊 性 一 一 模糊 数学 

这 里 应 该 指出 ， 随 机 性 和 模糊 性 尽管 都 是 对 事物 不 确定 性 的 描述 , 但 二 者 是 不 能 混淆 
的 。 统 计数 学 研究 随机 现象 ， 所 研究 的 事物 本 身 有 着 明确 的 含义 ， 只 是 由 于 条 件 不 充分 ,使 
得 在 条 件 与 事件 之 间 不 能 出 现 决定 性 的 因果 关系 ， 这 种 在 事件 的 出 现 与 否 上 表现 出 的 不 确定 
性 称 为 随机 性 。 模 糊 数 学 是 研究 和 处 理 模糊 现象 的 ， 所 研究 的 事物 的 概念 本 身 是 模糊 的 ， 即 
一 个 对 象 是 否 符合 这 个 概念 难以 确定 ， 这 种 由 于 概念 的 外 延 的 模糊 而 造成 的 不 确定 性 称 为 模 
糊 性 。 

在 随后 的 几 十 年 中 ,模糊 数学 在 理论 上 不 断 发 展 与 完善 ， 应 用 也 日 益 广泛 。 它 在 模糊 系 
统 与 模糊 控制 、 模 式 识别 、 专 家 系统 、 信 和 号 处 理 、 机 器 人 以 及 决策 分 析 等 多 个 领域 都 得 到 了 
应 用 。 

在 模糊 控制 方面 ，1974 年 ， 英 国 的 E. H. Mamdani 首次 用 模糊 逻辑 和 模糊 推理 实现 了 世 
界 上 第 一 个 实验 性 的 蒸汽 机 控制 ， 并 取得 了 比 传统 的 直接 数字 控制 算法 更 好 的 效果 ， 从 而 宣 
告 模糊 控制 的 诞生 。 

1980 年 ， 丹 麦 的 L. P. Holmblad 和 Ostergard 在 水 泥 窑 炉 中 采用 模糊 控制 并 取得 了 成 功 ， 
这 是 第 一 个 商业 化 的 有 实际 意义 的 模糊 控制 需 。 

自 20 世纪 80 年 代 后 ， 模 糊 控制 的 应 用 技术 逐渐 趋 于 成 熟 ， 应 用 范围 也 越 来 越 广 ， 目 前 
已 经 扩展 到 大 众 化 产品 中 ， 例 如 ， 洗 衣 机 、 电 冰箱 、 空 调 、 吸 尘 需 等 ; 另 一 方面 ， 各 芯片 公 
司 也 纷纷 推出 了 具有 模糊 运算 、 模 糊 推理 功能 的 专用 芯片 ， 从 而 使 模糊 控制 技术 更 好 地 用 于 
各 种 产品 的 开发 与 研究 。 


5.2 模糊 理论 的 数学 基础 
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合 是 数学 的 一 个 基本 分 支 ， 在 数学 中 占据 着 一 个 极其 独特 的 地 位 ， 其 基本 概念 已 经 渗 
透 到 数学 的 所 有 领域 。 对 于 集合 的 概念 ， 集 合 论 的 创立 者 德国 数学 家 康 托 ( George Contor) 
是 这 样 定义 的 : 把 若干 确定 的 、 有 区 别 的 (不 论 是 具体 的 或 抽象 的 ) 事物 合并 起 来 ， 看 作 
一 个 整体 ， 这 个 整体 就 叫做 集合 ， 其 中 的 每 个 事物 称 为 该 集合 中 的 元 素 。 

2. 集合 的 基本 术语 

(1) 论 域 把 要 考虑 的 事物 (对象) 的 全 体 称 为 论 域 , 通常 以 英文 大 写字 母 如 U、V、 
X、y、2 等 表示 。 

(2) 元 素 ” 论 域 中 的 每 个 成 员 称 为 元 素 ， 通 常 以 英文 小 写字 母 a、b、c 等 表示 。 

(3) 空 集 不 包含 任何 元 素 的 集合 称 为 空 集 。 
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(4) 有 限 集 和 无 限 集 若 组 成 一 个 集合 的 元 素 是 有 限 的 ， 则 称 为 有 限 集 ; 否则 称 为 无 
限 集 。 
(5) 子 集 者 集合 4 中 的 一 部 分 元 素 组 成 集合 ， 并 且 B 的 所 有 元 素 都 属于 4， 则 称 集 
合 B 是 集合 4 的 子 集 。 
3. 经 典 集合 的 运算 
经 典 集 合 最 基本 的 运算 有 并 、 交 、 差 、 补 共 四 种 。 
(1) 并 集 ” 设 有 论 域 U 上 的 三 个 集合 4、B 和 CcC， 若 C 中 的 所 有 元 素 不 属于 4 就 属于 
B， 则 称 C 为 4 和 B 的 并 集 ， 记 为 4UB， 即 
C=AUB={xlxehA 或 xeB} 
(2) 交集 ” 设 有 论 域 U 上 的 三 个 集合 4、B 和 CC， 车 C 中 的 所 有 元 素 既 属于 4 又 属于 
B， 则 称 C 为 4 和 B 的 交集 ,， 记 为 4nB， 即 
C=ANMB={xlxeA HH xepB} 
(3) 差 集 ” 设 有 论 域 U 上 的 三 个 集合 4、B 和 C， 若 C 中 的 所 有 元 素 是 由 属于 4 但 不 属 
于 B 的 元 素 所 构成 的 集合 ， 则 称 C 为 4 和 B 的 差 集 ， 记 为 4\ B 或 4-B， 即 
C=A-B={xlxeA HH x¢B} 
(4) 补 集 ” 设 有 论 域 U 上 的 集合 4， 则 称 0 中 不 属于 4 的 所 有 元 素 组 成 的 集合 B 为 4 
的 补 集 ， 记 为 44， 即 








B=A°=U-A={xlx¢A HB xeU} 
上 面 的 经 典 集 合 运 算 可 以 用 图 5-1 中 的 阴影 来 表示 。 
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AUB ANB A-B 
图 5-1 经 典 集合 运算 图 例 


4. 经 典 集合 运算 的 性 质 

设 4、B、C 为 论 域 UVU 上 的 三 个 经 典 集 合 ， 则 其 运算 具有 如 下 性 质 . 
(1) 交换 律 AUB=BUA, AMB=BNMA4 

(2) 结合 律 ”(4UB)UC=AU(BUC), (ANMB)NC=AN(BNMC) 

(3) 分 配 律 AN(BUC)= (4NB)U(ANC), (4NB)NC=AN(BNMC) 
(4) 同一 律 AUU=U, ANU=4 

(5) 对 偶 律 ( 德 . 摩根 律 ) (4UB)“=A°NB“, (4mMB)“=A°UB° 
(6) 双重 否定 律 (45)5=4 

(7) 互补 律 4U45=U,4n45= 人 (他 


5.2.2 模糊 集合 的 基本 概念 


经 典 集合 具有 两 条 最 基本 的 性 质 : 一 是 元 素 之 间 界 限 分 明 、 概 念 清晰 ; 二 是 元 素 与 集合 
之 间 的 关系 也 很 清晰 ， 要 么 是 “属于 ” ， 要 么 是 “不 属于 ”， 非 此 即 彼 。 如 果 我 们 用 “隶属 
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度 ” 这 个 概念 来 表示 集合 中 的 某 一 个 元 素 x 隶属 于 集合 4 的 程度 ,那么 ,在 经 典 集 合 中 ， 
隶属 度 只 有 两 个 值 :“1” 或 “0”， 即 
l,xeA 
Ma(%)= 0,x¢A 
1. 模糊 集合 的 定义 
如 果 将 隶属 度 的 值 域 推广 到 闭 区 间 [0，1] ， 在 此 区 间 中 , p(x) 越 大 ， 表明 x 隶属 于 
集合 4 的 程度 越 高 ， 反 之, x 隶属 于 集合 4 的 程度 越 低 。 这 样 ， 我 们 就 有 了 模糊 集合 的 
定义 。 
【定义 5-1】 已 知 论 域 U,U 到 [0，1] 闭 区 间 的 任 一 映射 
Wa: UL0,1] 
LA 人) 
都 确定 U 的 一 个 模糊 子 集 4，p4 称 为 模糊 子 集 的 隶属 函数 ，Ai(z) 称 为 u 对 于 4 的 隶属 度 。 
显然 ， 当 Mi(z) 的 值 域 为 10，1} 时 ,模糊 集合 已 经 赔 变 为 经 典 集合 了 。 
2. 模糊 集合 的 表示 方法 
对 于 论 域 了 上 的 模糊 集合 4， 常 用 的 表示 方法 有 如 下 几 种 。 
当 U0 为 离散 有 限 域 lx ，x,，…， x | 时 ， 常 用 zadeh 表示 法 、 序 偶 表 示 法 以 及 向 量 表 
示 法 来 表示 模糊 集合 。 
(1) zadeh 表示 法 





























_ Ma %1) Kat%2) Py Na) 于 Mal Ni) 


Xl X2 区 





(2) 序 偶 表示 法 
= | (x1 ,p41)) ,xo Hal x2)) ,ee, CK Hal Xn) )| 
(3) 向 量 表示 法 
A= {pa x1) Heal Xo) ,ee ,MA Kn) | 

该 方法 中 隶属 度 必 须 按照 元 素 的 顺序 排列 。 

【 例 5-1】 已 知 论 域 VC= | 语文 ,数学 ,体育 ,音乐 ,美术 ,英语 | ， 模 糊 集合 4=“ 王 对 功 
课 的 爱好 ”可 分 别 表示 为 

zadeh 法 
了 .0.8 0.6 09 03 .02 
语文 数学 体育 "音乐 美术 英语 





A= 





ee 
= 上 | (语文 ,0.5) ,( 数 学 ,0.8) ,( 体 育 ,0.6) ,( 音 乐 ,0.9) ,( 美 术 ,0.3) ,( 英 语 ,0.2 
站 
A=(0.5 0.8 0.6 0.9 0.3 0.2) 
虽然 4 是 模糊 集合 ， 但 从 上 述 3 种 表示 方法 中 都 可 以 很 明确 地 看 到 : 王 同 学 非常 喜欢 音 
乐 ， 最 不 喜欢 英语 ， 其 他 各 门 功课 的 喜爱 程度 也 是 一 目 了 然 。 
(4) 解析 表示 法 
当 也 为 连续 域 时 ， 通 常 采用 隶属 函数 的 解析 式 表 示 法 来 表示 。 
【 例 5-2】 设 论 域 V= [0,100] ， 模 糊 集合 B= “数值 在 50 左右 ”， 可 以 用 解析 表达 式 来 
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表示 论 域 上 任何 一 个 元 素 x 对 于 集合 B 的 隶属 度 为 


1 
Mp(%)= xeU 


HS] 
10 

从 解析 表达 式 中 ， 可 以 求 出 论 域 中 任何 一 个 数值 对 于 模糊 集合 B 的 隶属 度 ， 例 如 Ha 
(10)= 0.0039、 wa(50)= 1、Mz(55.5)= 0.916， 显 然 55.5 比 10 属于 “数值 在 50 左右 ”这 
一 集合 的 程度 更 高 。 

3. 常用 的 隶属 度 函 数 

为 了 满足 实际 工作 的 需要 ， 同 时 兼顾 运算 与 处 理 方便 ， 和 常用 以 下 隶属 函数 来 表示 模糊 
集合 。 























(1) 三 角 型 
0 Xa 
a<x<b 
flxsasb,c)=1 
二 b<xce 
c-b 
0 x>c 
(2) 钟 型 
1 
f(x,a,b,c)= 


四 

1+| 一 一 

a 

其 中 , c 决定 函数 的 中 心 位 置 ，a、5b 决定 函数 的 形式 。 
(3) 高 斯 型 














Co 
2 


f(x,0,c)=e 2 
其 中 ,c 决定 函数 的 中 心 位 置 ，o 决定 函数 曲线 的 高 度 。 


(4) 梯 型 
0 x<a 
ee a<x<b 
flx,a,b,c,d)= 1 b<x<e 
. c<x<d 
0 x>d 





(5) Sigmoid 型 


1 
f(x,a,c)= ee 


@-a(x-e) 
其 中 a、c 决定 函 数 的 形状 。 
正确 地 确定 隶属 函数 ， 是 运用 模糊 集合 理论 解决 实际 问题 的 基础 。 隶 属 函数 在 确定 的 过 
程 中 ， 本 质 上 说 是 客观 的 ， 但 每 一 个 人 对 于 同一 个 模糊 概念 的 认识 和 理解 又 有 差异 ， 因 此 ， 


DD 
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隶属 函数 的 确定 又 带 有 主观 性 。 一 般 是 根据 经 验 或 统计 来 选取 初步 的 隶属 函数 ， 再 通过 不 同 
的 学 习 与 校正 将 其 逐步 完善 ; 也 可 以 由 专家 、 权 威 给 出 。 事 实 上 ， 模 糊 集合 是 依赖 于 主观 来 
描述 客观 事物 的 概念 外 延 的 模糊 性 ， 尽 管 不 同人 给 出 的 隶属 函数 的 形式 不 完全 相同 ， 只 要 能 
反映 同一 个 模糊 概念 ， 在 解决 和 处 理 实际 模糊 信息 的 问题 中 仍然 殊途同归 。 可 以 设想 ， 如 果 
对 任 一 模糊 集合 都 有 准确 的 隶属 函数 的 确定 方法 ， 那 么 所 谓 的 “模糊 性 ”也 就 不 存在 了 。 
4. 模糊 集合 的 运算 
设 A4、B 为 论 域 UU 上 的 两 个 模糊 集合 ， 则 模糊 集合 的 基本 运算 定义 如 下 : 
(1) 包含 ” 奉 对 于 U 中 的 每 一 个 元 素 w， 都 有 jwa(u) p(wu)， 则 称 4 包含 B， 记 作 42B。 
(2) 相等 ”如 果 428 且 B24， 则 称 4 与 B 相等， 记 作 4=B， 即 对 于 论 域 U0 中 的 每 一 
个 元 素 都 有 ja(u)=Mp(u)o 
(3) 并 运算 (4UB) ”对 于 论 域 0 中 的 每 一 个 元 素 uw,， 都 有 jp(u)=Ma(u) Vungp(u)， 
式 中 “V” 表 示 取 大 运算 。 
(4) 交 运 算 (4nB) ”对 于 论 域 0 中 的 每 一 个 元 素 w,， 都 有 jna(u)=pa(u) App(u)， 
式 中 “和 ”表示 取 小 运算 。 
(5) 补 运算 (45) Hic(z)= 1-p4(u)。 
【 例 5-3】 设 4 与 B 是 论 域 Y 上 的 两 个 模糊 集合 , 已 知 4=|0.4,0.6,0.8,0.5,0.3|}， 
B=|0.7,0.2,0.6,0.9,0.1} ， 则 通过 模糊 集合 的 运算 可 以 得 到 
AUB=|0.4V0.7,0.6V0.2,0.8V0.6,0.5V0.9,0.3V0.1}=|0.7,0.6,0.8,0.9,0.3| 
ANMB=|0.4A0.7,0.6A0.2,0.8A0.6,0.5A0.9,0.3A0.1}=|0.4,0.2,0.6,0.5,0.1) 
A‘=|0.6,0.4,0.2,0.5,0.7| 


5. 2. 3 模糊 关系 与 复合 运算 


1. 模糊 矩阵 与 模糊 关系 

客观 事物 之 间 往 往 都 有 一 定 的 联系 ， 描 述 这 种 联系 的 数学 模型 称 为 关系 。 经 典 关 系 用 来 
表示 两 个 或 两 个 以 上 集合 元 素 之 间 是 否 有 关联 、 交 互 、 互 连 等 关系 存在 ， 它 只 有 “有 ”或 
“无 ”两 种 状态 ， 因 此 特征 函数 只 能 取 “0” 或 “1” 两 个 值 。 而 模糊 关系 用 来 表示 两 个 或 
两 个 以 上 集合 元 素 之 间 关 联 、 交 互 、 互 连 等 关系 的 程度 ， 其 特征 函数 可 以 取 [0，1] 之 间 
的 任意 值 。 

【定义 5-2】 设 4、B 为 论 域 U 上 的 任意 两 个 集合 ， 符 从 4、B 中 各 取 一 个 元 素 x € 4， 
yeB， 按照 先 4 后 B 的 顺序 搭配 成 元 素 对 (*，y) ， 称 为 序 偶 或 序 对 。 所 有 以 序 偶 构 成 的 集 
合 ， 称 为 集合 4 到 集合 B 的 直 积 (或 笠 卡 尔 积 ) ， 记 为 

AxB=|(x,y)IxeA,yeB| 
直 积 不 满足 交换 率 ， 即 一 般 情况 下 ，AxB 关 BxA4。 

【 例 5-4】 设 集合 4=|1,2,3,4| 、B=|x,y| , 求 AxB 和 Bx4。 

AxB= | (C18) ,C17) 24) 2,9) (3) ,C37) (40), (dy)] 
| 

【定义 5-3】 两 个 非 空 集合 0 与 V 之 间 的 直 积 

UxV= | (u,v)lueU,veVl| 
中 的 一 个 模糊 子 集 RR 被 称 为 是 U 到 VV 的 模糊 关系 。 模 糊 关 系 R 可 以 由 下 面 的 隶属 函数 来 
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表示 : 





HAR:UXT 一 [0,1] 
模糊 关系 R 可 以 用 和 矩阵 的 形式 来 表示 ， 这 样 的 矩阵 称 为 模糊 算 阵 。 
【 例 5-5】 设 0=|ai,as,…,a| 表示 m 个 工厂 的 集合 ，V= 14051,b;,…,0b,| 表示 n 种 化 
学 原料 的 集合 ， 对 于 每 个 a,eU(i=1,2,…,m), beV(j=1,2,…,n), 用 jr(ai,b;) e[0,1] 
来 表示 工厂 a; 对 原料 5, 的 依赖 关系 ， 则 模糊 矩阵 


Mr( a1,0b1) Kal a1,b2) a Ma(a1,b,) 
Kr( a2,01) Kal & ,02 ) 3 Kr( a2 ,0,) 
KRCansbi) KrCamsb2) … ARCanyon) 


就 表示 从 U 到 VV 的 一 个 模糊 关系 。 如 果 m=3，n=4， 模 糊 关 系 为 
0.2 0.8 0.6 0.7 
ee 0.1 0.7 0.5 
0.6 0.4 0.3 0.9 
那么 可 以 看 出 ,工厂 aj 对 于 原料 六 的 依赖 程度 最 高 ， 而 对 5b 的 依赖 程度 最 低 ; 对 于 
原料 by 而 言 ， 工 厂 a3 对 其 依赖 度 最 高 ， 而 as 对 其 依赖 度 最 低 。 
2. 模糊 矩阵 的 运算 
模糊 矩阵 是 一 个 模糊 关系 R 的 表示 ， 其 并 、 交 、 补 有 相应 的 运算 方法 。 设 RR、0 为 两 个 
模糊 矩阵 ， 尺 =(ry) jxn，Q= (gy) mxno 
(1) 并 运算 RUQ=(rjVg;) xs， 即 两 个 相应 的 元 素 都 做 取 大 运算 。 
(2) 交 运 算 RAMQ=(rj; 信 gj) xn， 即 两 个 相应 的 元 素 都 做 取 小 运算 。 
(3) 补 运 算 R=(1-r;) nxno 
【 例 5-6】 已 知 P、5 两 个 模糊 矩阵 关系 分 别 为 


0.8 1 0.1 0.7 0.4 0 0.9 0.6 
0 0.8 0 0 1,S=|0.9 0.4 0.5 0.7|， 
0.9 1 0.7 0.8 


0.3 0 0.8 0.5 
求 PUS、PNMS 以 及 P<。 
由 模糊 矩阵 的 运算 方法 可 知 
0.8V0.4 1V0 0.1V0.9 | 0.8 1 0.9 1 





P= 








PUS=| 0V0.9 0.8V0.4 0V0.5 OV0.7 |=|0.9 0.8 0.5 0.7 
0.9V0.3 1V0O 0.7V0.8 0.8V0.5) \0.9 1 0.8 0.8 
0.8A0.4 1A0 0.1A0.9 0.7A0.6Y /0.4 0 0.1 0.6 
PMS=| 0A0.9 0.8A0.4 0A0.5 oo7 | 0 0.4 0 ,| 
0.9A0.3 1A0 0.7A0.8 0.8A0.5) \0.3 0 0.7 0.5 

1-0.8 1-1 1-0.1 1-0.7) /0.2 0 0.9 0.3 
PC=| 1-0 1-0.8 1-0 | 0.2 1 | 

1-0.9 1-1 1-0.7 1-0.8) \0.1 0 0.3 0.2 
3. 模糊 关系 的 合成 运算 
【定义 5-4】 车 RR 和 5 分别 为 UxV 和 x 色 中 的 模糊 关系 ， 则 尺 和 8 的 合成 是 一 个 从 U 
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到 丈 的 模糊 关系 ， 记 为 ReS， 其 隶属 度 为 
Kpes(UsWw)= V (Wal ud) MAus(v,w)), VueU,weW 

式 中 ，V 和 和 分 别 是 “ 取 大 ”和 “ 取 小 ”运算 ， 通 党 把 这 种 运算 称 为 取 大 一 取 小 合成 法 。 

模糊 关系 的 合成 运算 与 矩阵 的 乘法 非常 类 似 ， 只 不 过 将 矩阵 乘法 中 的 “ 相 乘 ” 改 为 
“ 取 小 ” ， 将 矩阵 乘法 中 的 “ 相 加 ” 改 为 “ 取 大 ”。 

【 例 5-7】 令 X=11,2,31 代 表 公 司 中 的 三 个 员工 ，Y= | 协作 能 力 ,钻研 能 力 ,沟通 能 
创新 能 力 } 代表 四 种 能 力 的 集合 ，Z = 4a,b| 代表 公司 中 的 两 种 性 质 的 工作 。 目 前 三 个 员工 各 
种 能 力 可 用 模糊 关系 R 表示 ， 而 两 种 性 质 的 工作 所 需要 的 能 力 用 模糊 关系 $ 表示 : 














0.9 0.5 
0.1 0.3 0.5 0.7 
0.2 0.8 
R(X,Y)=|0.4 0.2 0.8 0.9 S(Y,Z)= 
0.5 0.4 
0.5 0.8 0.3 0.2 
0.8 0.2 


过 模糊 关系 合成 ， 得 到 





沿 


0.7 0.4 
ee 四 
0.5 0.8 
其 中 第 二 行 的 第 一 个 元 素 是 这 样 得 到 的 : 
MRes(2,4)= (0.4A0.9)V (0.2A0.2)V (0.8A0.5)V (0.9A0.8)= 0.4V0.2V0.5V0.8=0.8 
通过 合成 得 到 新 的 模糊 关系 ReS 就 是 三 个 成 员 1、2、3 与 两 种 工作 a、5。 之 间 的 适合 关 
系 ， 于 是 公司 主管 可 以 根据 这 种 关系 选择 1、2 从 事 a 工作 ，3 从 事 工作 。 


5.3 模糊 推理 


传统 的 命题 逻辑 中 ， 命 题 为 二 值 逻辑 ， 即 要 么 是 “ 真 "”， 要 么 是 “ 假 *。 比 如 “3 大 于 
5” 为 “ 假 ”,“ 北 京 是 中 国 的 首都 ”为 “ 真 ”。 然 而 ， 并 非 所 有 的 陈述 句 都 能 有 确定 性 的 判 
斯 ， 例 如 “这 项 发 明 有 非常 重大 的 意义 ”“ 这 条 小 河水 很 深 ” 等 ， 其 中 , “非常 重大 ”“ 很 
深 ” 都 是 模糊 概念 ， 无 法 用 “ 真 ”“ 假 ”来 判断 ， 对 于 这 样 的 命题 ， 我 们 称 其 为 模糊 命题 ， 
把 研究 模糊 命题 的 逻辑 称 为 “模糊 逻辑 ”。 

模糊 逻辑 是 建立 在 模糊 集合 和 二 值 逻 辑 概念 基础 上 的 一 类 特殊 的 多 值 逻 辑 ， 是 二 值 逻 辑 
在 模糊 集合 论 上 的 推广 。1960 年 ， 美 国 的 Marinos 在 电话 实验 室 的 一 份 内 部 研究 报告 中 提出 
模糊 逻辑 的 概念 。1972 年 到 1974 年 ，Zadeh 先后 提出 了 模糊 限定 词 、 语 言 变量 和 近似 推理 
关系 等 关键 概念 ， 制 定 了 模糊 推理 的 复合 规则 ， 为 模糊 逻辑 系统 奠定 了 基础 。 
5. 3. 1 模糊 条 件 语句 

设 4 和 8B 分别 代表 两 个 简单 的 模糊 命题 ， 如 果 它 们 之 间 有 一 种 模糊 依存 关系 ， 例 如 可 
表述 为 “如 果 4 则 8”， 则 称 该 复合 命题 为 模糊 条 件 命 题 ， 也 称 模糊 条 件 语句 。 

常用 的 模糊 条 件 语句 根据 句 型 可 分 为 以 下 几 种 ; 

(1)“ 如 果 4 那么 B” (if A then B) 

1) Zadeh 算法 。 设 有 论 域 X，Y， 模 糊 集合 A eX ，B e Y， 奋 存在 XxXY 上 的 二 元 模糊 关 


G17) 
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系 尺 =4 一 B， 则 其 隶属 函数 为 
WRK,sy)=p4 8X7)= 1-pa (x) | Vpa(x) Apaly) 


因此 模糊 关系 为 
R=A° UAxB 
【 例 5-8】 设 论 域 X=Y=11,2,3,4,5} ,XX、Y 上 的 模糊 子 集 “ 大 ”“ 小 ”分 别 给 定 如 下 : 
0.4 0.7 1 
大] 
Fj? 0.4 


3 
试用 Zadeh 算法 求 “ 若 x 小 则 y 大 ”的 模糊 关系 R。 
解 : Zadeh 算法 求 模糊 关系 


0 1 0 0 0 04 07 1 
0.3| 10.7 0.3| |0 0 0.4 07 0.7 
R=[ 小 J]<U[ 小 ]x[ 大 ]=|0.6|UI0.4Ix(0 0 04 07 1)=I0.6|lUI0 0 0.4 0.4 0.4 
1 0 1 000 0 0 
1 0 1 000 0 0 





其 中 ， 
HR (Xs7)= [1 小 (xz)] VLAACz) AM 大 (y7)] 
例如 ，R 中 的 第 三 行 第 四 列 的 隶属 度 计 算 为 : 
pp. (3,4)=[1-pn(3)] VEpn(3) Aux(4)]=(1-0.4) V(0.4A0.7)= 0.6V0.4=0.6 
2) Mandani 算法 
Mandani 算法 为 Zadeh 算法 中 略 去 [1-w(x)] 的 部 分 所 得 到 的 。 
设 有 论 域 X、Y， 模糊 集合 4e 外，B e Y， 奉 存在 XxXY 上 的 二 元 模糊 关系 R=4 一 8， 则 








MR,Y)=pa B(x,y)= Ha) Apaly) 
因此 模糊 关系 为 
R=AxB 
【 例 5-9】 已 知 条 件 同 例 5-8， 试用 Mandani 算法 求 “ 若 * 小 则 y 大 ”的 模糊 关系 R。 
解 : Mandani 算法 求 模糊 关系 





1 0 0 0.4 0.7 1 
0.7 0 0 0.4 0.7 0.7 
尼 =[ 小 ]x[ 大 ]=|0.4|x(0 0 0.4 0.7 1)=l0 0 0.4 0.4 0.4 
0 000 0 0 
0 000 0 0 
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其 中 ， 
NMRCX,yY) = 人 小 (X) 人 AN 大 (7) 
例如 第 二 行 第 五 列 的 隶属 度 计算 为 
MAR(2,5)= 人 小 (2) AH 大 (5)= 0.7A1=0.7 

(2)“ 如 果 A4 那么 B 否 则 C” (if 4 then B else C) 

设 有 论 域 X，Y， 模 糊 集 合 4eX，BeY, CeY， 若 存在 XxY 上 的 二 元 模糊 关系 R= (4 一 
B) V (4 一 C)， 则 其 隶属 函数 为 

HR(X,Y)=M asB) V CAC SHC) (X,Y)= [ual%) AHMa(y) ] V[(CL-A4Cx) ) Ape(y)] 

因此 模糊 关系 为 








R=(AxB) U (A°xC) 
【 例 5-10】 已 知 X= ol ,az ,aa ,ao ，Y=|461,b5,b3,b4,b;| ，X、Y 上 的 模糊 子 集 “ 西 红 
柿 红 ”“ 成 熟 ” 分 别 给 定 如 下 : 


























解 :首先 求 取 模糊 子 集 “不 成 熟 "， 显然 
各 0 0.7 0.5 0.3 0 
G= 就 ] =1--[ 成 熟 ] = 一 + 一 一 + 一 一 + 一 一 + 
I 

0 1 

0.1 0.9 
R=(4xB) U(ACxC)= 和 x(0 0.3 0.5 0.7 全 x(1 0.7 0.5 0.3 0) 

1 0 





0 0 0 0 1 0.7 0.5 0.3 0) 2 人 1 0.7 0.5 0.3 0 
0.1 0.1 0.1 0.1 0.9 0.7 0.5 0.3 0| 420.9 0.7 0.5 0.3 0.1 
0 
0 


La 


U 
0.3 0.5 0.6 0.6 0.4 0.4 0.4 0.3 a3|l0.4 0.4 0.5 0.6 0.6 
0 0.3 0.5 0.7 1 0 0 0 0 aa\0 D3 0.5 07 1 


(3)“ 如 果 A4 且 B 那 么 C”(if A and B then C) 

设 有 论 域 了 ，Y，Z， 模 糊 集合 Ae 处 ，BeY 了 ,Ce Z， 若 存在 三 元 模糊 关系 R= (AxB) 一 > 
C， 则 其 隶属 函数 为 

HR(CXZ yz)=NR-Uxp sc XY,2)= pax) ABCY) Melz)=pa(x) Npp(y) A z) 
因此 模糊 关系 为 











R=AxBxC 
Ka(%,y,z) 是 一 个 三 元 关系 ,通常 ， 这 种 三 元 关系 的 求解 过 程 如 下 : 
假设 论 域 4 中 有 m 个 元 素 ， 论 域 中 有 nn 个 元 素 , 论 域 C 中 有 p 个 元 素 ， 则 由 4AxB 构 
成 的 模糊 关系 RR 为 mxn 的 二 维和 矩阵 








(119) 
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m1 72 Tm 
721 722 “”” Tom 
Tnl 772 本 7 pm 


当 二 维和 矩阵 与 有 pp 个 元 素 的 向 量 进 行 运算 时 ， 则 首先 将 此 二 维和 抢 阵 按 行 展 开 成 列 向 量 ， 
然后 再 与 有 p 个 元 素 的 向 量 进行 运算 。 
【 例 5-11 】 BE 430 1 Be 


al a b! b, bs Cc! co C3 C4 
B 那么 C” 的 模糊 关系 R。 
解 : 首先 计算 R =4xB 
0.3 0.3 0. | 


0.3 
i ti tis i 
0.8 0.3 0.5 0.8 
将 Ri 按 行 展 开 成 列 向 量 ， 则 
RI=(0.3 0.3 0.3 0.3 0.5 0.8) 
由 此 得 到 三 元 模糊 关系 


求 “ 如 果 4 上 是 








0.3 0 1 也 1 
0.3 0.1 0.3 0.3 0.1 
0.3 O01 03 03 0 1 
R=AxBxC=R]|xC= x(0.1 0.7 0.8 0.1)= 
.3 0.1 0.3 0.3 0.1 
由 0.1 0.5 0.5 0.1 
0.1 








0.8 1 07 0 


5. 3. 2 模糊 推理 


1. 模糊 推理 的 描述 
模糊 推理 是 以 模糊 命题 为 前 提 ， 运 用 模糊 推理 规则 得 出 新 的 模糊 命题 的 思维 过 程 ， 它 是 
经 典 逻 辑 推理 方法 的 推广 。 
以 经 典 的 逻辑 推理 中 常用 的 假 言 推理 为 例 ， 其 假 言 推理 的 结构 如 下 : 
小 前 提 (事实 ) 4 
大 前 提 (规则 ) A—B 
结论 B 
例如 ， 公 园 规定 身高 超过 1. 2m 的 孩子 必须 购买 门票 (规则 ) ， 小 楠 身 高 为 1.28m ( 事 
实 )， 所 以 ， 她 必须 购买 门票 才能 入 园 (结论 ) 。 
在 经 典 推理 中 ,事实 中 的 4 与 规则 中 的 4 是 同一 个 集合 (在 本 例 中 均 为 身高 超过 
1.2m) ， 同 样 规则 中 的 B 与 结论 中 的 B 也 是 同一 个 集合 (在 本 例 中 为 购买 门票 ) 。 
而 模糊 推理 结构 为 


























小 前 提 (事实 ) A’ 
大 前 提 (规则 ) A—B 
结论 B' 


其 中 4 与 4'、B 与 B' 都 可 以 是 不 同 的 模糊 集合 。 例 如 ， 如 果 春 天 比较 温暖 ,那么 山花 
(120) 
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开放 的 时 间 会 早 些 (模糊 规则 ) , 今年 春天 气温 偏 低 (事实 )， 所 以 今年 山花 的 开花 时 间 会 
晚 一 些 (结论 )。 这 里 事实 “今年 春天 气温 偏 低 ” 与 规则 中 的 条 件 “ 春 天 比较 温 暧 ”并 非 
同一 个 模糊 集合 ， 但 仍 能 够 得 到 合理 的 结论 ， 这 就 需要 我 们 进一步 了 解 模糊 推理 的 方法 。 

2. 模糊 推理 

关于 模糊 推理 的 方法 ， 比 较 常 见 的 有 Zadeh 法 、Mandani 法 、Yager 法 和 Larsen 法 等 ， 
下 面 主要 介绍 Zadeh 法 和 Mandani 法 。 

模糊 推理 的 过 程 如 图 5- 2 所 示 ， 其 中 ，R 是 进行 推理 的 大 前 提 ， 是 通过 大 量 实 验 和 实践 
经 验 进行 总 结 、 去 伪 存 真 后 形成 的 模糊 规则 ，A' 是 小 前 提 ， 是 进行 模糊 推理 的 条 件 。 模 糊 推 
理 是 通过 似 然 推理 合成 法 则 


























B'=A’'cR=A’. (A—B) 
来 实现 的 ， 而 不 同 的 推理 方法 主要 来 自 于 针对 模糊 关系 4 一 B 的 不 同 处 理 方法 。 
(1) Zadeh 推理 法 “” 设 有 论 域 Z，7， 模 糊 集 合 4 eX， 


xis4 - yisB’ 
Be yy， 并 存在 XxY 上 的 二 元 模糊 关系 R=4 一 B， 根 据 5. 3. 1 
中 Zadeh 算法 ，R=4-*8 的 隶属 函数 为 图 5-2 ”模糊 推理 过 程 


MRr(X,Y)= [1 -Ma )] VAHA4(Cx ) AHMB(y) 
则 根据 似 然 推 理 合 成 法 则 有 


从 (7)= V lpa' (%) AL(L-Aa(Cx) ) Vpa(x) App(y) ] | 
(2) Mandani 推理 法 ”根据 5$. 3. 1 中 Mandani 算法 ，R=A4 一 B 的 隶属 函数 为 
Mr(%,y)=Ma(x) Nply) 











则 根据 似 然 推 理 合成 法 则 有 
Ha (y)= V Npa' Cx) Apa(%) Mpaly)| 
【 例 5-12】 设 论 域 X=Y= 11,2,3,4,5|1，X、 工 上 的 模糊 子 集 “ 大 ”“ 小 ”“ 较 小 ”分 别 
给 定 如 下 : 





0.4 420.7 1 
I 
[小 ]- 工 0.740.4 


T 3 
0.4 0.6 04 0.2 
Le 和 十 本 十 
已 知 规则 : 大小 则 y 大; 当 x 较 小 时 ， 人 
解 : 首先 用 向 量 形式 表示 各 模糊 子 集 : [大 ]=(0 0 0.4 0.7 1), [小 ] = 
(1 0.7 0.4 0 0)，[ 较 小 ]=(0.4 0.6 0.4 0.2 0)。 
(1) 先 根 据 规 则 “ 若 * 小 则 y 大 ” 求 模 糊 关 系 尺 由 例 5-8 和 例 5-9 可 知 
1) Zadeh 算法 求 模 糊 关 系 





0 0.4 0.7 1 
0.3 0.3 0.4 0.7 0.7 
RI=I0.6 0.6 0.6 0.6 0.6 
1 1 1 1 
1 1 1 1 1 


《121)》 


99》 人 工 智能 技术 





2) Mandani 算法 求 模糊 关系 

0.4 0.7 1 
0.4 0.7 0.7 
0.4 0.4 0.4 
0 0 0 
0 0 0 


R, 


ll 
[= 
[= 


(2) 求 模糊 合成 
1) 用 Ri 求 模 糊 合 成 关系 
0 0 0.4 0.7 1 
0.3 0.3 0.4 0.7 0.7 
[y] =[ 较 小 ] .Ri =(0.4 0.6 0.4 0.2 0)。0.6 0.6 0.6 0.6 0.6 
1 1 1 1 1 
1 1 1 1 1 
=(0.4 0.4 0.4 0.6 0.6) 
即 得 到 
Od 404 06 0 








BW 
2) Mandani 算法 求 模糊 关系 

0 0 04 07 1 
0 0 04 07 0.7 

[y]=[ 较 小 ]oRj=(0.4 06 04 0.2 0)o0 0 04 04 04|=(0 0 04 06 0.6) 
000 0 0 
000 0 0 

即 得 到 [y= + te 


上 面 两 种 不 同 的 算法 得 到 不 同 结果 ， 但 是 我 们 可 以 看 到 无 论 哪 种 方法 ，[y] 与 [大 ] = 
二 相 比 ， 显然 要 小 一 些 ， 因 此 ， 都 应 该 为 「 比较 大 ]。 

从 上 例 中 我 们 看 到 根据 规则 “车 小 则 y 大 ” ， 通 过 两 种 模糊 推理 均 可 得 到 “ 当 较 小 
时 ，y 较 大 "， 这 样 的 推理 结果 显然 很 符合 正常 的 逻辑 思维 结 


s.4 模糊 控制 系统 及 模糊 控制 器 


模糊 控制 是 以 模糊 集合 论 、 模 糊 逻 辑 推理 为 基础 的 一 种 计算 机 数字 控制 。 从 线性 与 非 线 
性 控制 角度 分 类 ， 是 一 种 非 线性 控制 。 从 控制 器 的 智能 型 看 ， 属 于 智能 控制 的 范畴 ， 而 且 已 
成 为 目前 实现 智能 控制 的 一 种 重要 而 又 有 效 的 形式 。 尤 其 是 模糊 控制 与 神经 网 络 、 遗 传 算法 
及 混沌 理论 等 新 学 科 的 融合 ， 正 在 显示 出 其 巨大 的 潜力 。 
5. 4. 1 模糊 控制 系统 的 基本 结构 


模糊 控制 系统 是 一 种 计算 机 控制 系统 ， 因 此 具有 一 般 计算 机 控制 系统 的 基本 结构 ， 如 图 
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5-3 所 示 。 从 图 中 可 以 看 出 ,模糊 控制 系统 与 传统 控制 系统 的 区 别 仅 在 于 以 模糊 控制 器 取代 
了 传统 的 控制 器 。 


输入 量 r( 输出 量 y(7) 


(给 定 值 ) el?) 一 一 (被 控 量 ) 
[| 类- 一 











图 5-3 ”模糊 控制 融 结 构图 


模糊 控制 系统 由 传感器 获取 被 控 量 信息 ， 并 将 其 转化 为 与 给 定 值 具有 相同 量 纲 的 物理 
量 ， 然 后 将 此 转化 后 的 物理 量 与 给 定 值 进行 比较 后 获得 误差 信号 ， 经 A/D 转换 后 变 为 数字 
言 号 输入 到 控制 器 ， 信 和 号 在 模糊 控制 器 中 经 过 模糊 化 、 模 糊 推理 、 去 模糊 等 过 程 成 为 精确 量 
由 模糊 控制 器 输出 ， 再 经 D/A 转换 为 模拟 信和 号 推动 执行 元 件 控制 被 控 对 象 。 整 个 过 程 反复 
循环 ， 从 而 实现 了 整个 系统 的 反馈 控制 。 


5. 4. 2 模糊 控制 器 


1. 模糊 控制 器 的 组 成 

模糊 控制 器 (Fuzzy Controller, FC), 也 称 为 模糊 逻辑 控制 器 ( Fuzzy Logic Controller, 
FLC) ， 是 模糊 控制 系统 设计 的 关键 ， 其 基本 结构 主要 由 模糊 化 、 知 识 库 、 模 糊 推理 以 及 去 
模糊 化 等 四 部 分 组 成 。 

(1) 模糊 化 模块 ”主要 功能 是 将 模糊 - = 
控制 絮 输 入 的 精确 量 转 换 为 模糊 量 ， 输 入 量 
一 般 为 误差 信号 e， 以 及 误差 变化 率 Ae = 
de/di。 

(2) 知识 库 模 块 ”该 模块 通常 由 数据 
库 和 模糊 规则 两 部 分 组 成 。 数 据 库 主要 包括 












































语言 变量 的 隶属 函数 以 及 模糊 空间 的 分 级 数 ua - 
等 ， 规 则 库 包含 了 一 系列 模糊 规则 。 知 识 库 图 5.4 模糊 控制 器 的 组 成 





反映 了 该 领域 专家 的 经 验 与 知识 。 

(3) 模糊 推理 模块 ”根据 输入 模糊 量 与 相应 的 模糊 规则 进行 推理 ， 获 得 模糊 控制 量 。 

(4) 去 模糊 化 ”将 推理 所 得 的 模糊 量 进行 去 模糊 处 理 ， 转 化 成 可 以 被 执行 机 构 所 实现 
的 精确 值 。 

2. 模糊 控制 器 的 结构 

常用 的 模糊 控制 器 结构 按照 输入 的 维 数 分 为 下 面 几 种 : 

(1) 一 维 模糊 控制 器 ”控制 器 的 输入 仅 为 误差 信号 ， 这 种 控制 器 反映 了 一 种 比例 (P) 
控制 规律 ， 由 于 不 能 反映 过 程 的 动态 特性 ， 因 此 控制 效果 从 佳 。 

(2) 二 维 模糊 控制 器 ”控制 器 的 输入 为 误差 信号 。 与 误差 的 变化 率 de/d， 这 种 控制 器 
体现 了 比例 -微分 (PD) 的 控制 规律 ， 其 控制 效果 要 明显 好 于 一 维 控制 器 。 

(3) 三 维 模糊 控制 器 ”控制 器 的 输入 为 误差 信号 e 与 误差 的 变化 率 de/dt 以 及 误差 变化 
的 变化 率 die/di 。 由 于 输入 量 更 多 ， 因 此 控制 精度 更 高 一 些 。 
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a) 一 维 模糊 控制 器 b) 二 维 模糊 控制 器 9) 三 维 模糊 控制 器 
图 5-5 模糊 控制 器 的 结构 


在 控制 系统 设计 时 通常 根据 实际 需要 来 选择 模糊 控制 器 的 结构 。 目 前 ， 由 于 二 维 控制 咒 
能 够 较 好 地 反映 误差 信号 的 动态 特征 ， 有 较 好 的 控制 效果 ， 因 此 大 多 数控 制 系统 选用 二 维 模 
糊 控制 器 。 妆 被 控 系 统 比 较 简单 并 且 对 控制 精度 效果 没有 太 高 要 求 时 ， 可 以 考虑 采用 一 维 控 
制 咒 ， 一 维 控制 器 设计 简单 ， 处 理 速 度 快 。 从 理论 上 讲 ， 输 入 维 数 越 高 ， 系 统 的 控制 精度 就 
越 高 ， 然 而 ， 由 于 输入 维 数 多 ， 无 论 模糊 规则 的 建立 还 是 模糊 推理 都 比较 复杂 ， 实 现 较 为 困 
难 ， 因 此 ， 除 了 一 些 特 殊 场 合 很 少 使 用 三 维 控制 器 。 

以 上 介绍 的 模糊 控制 器 ， 都 具有 一 个 输出 变量 ， 当 系统 有 多 个 独立 的 输入 变量 与 输出 变 
量 时 ， 要 直接 设计 模糊 控制 器 就 非常 困难 了 ， 为 此 要 考虑 如 何在 结构 上 实现 解 耘 ， 将 一 个 多 
输入 /多 输出 的 模糊 控制 器 分 解 为 知 干 个 多 输入 / 单 输出 的 控制 器 ， 分 别 按照 上 面 的 方法 进行 
设计 ， 最 后 再 加 以 组 合 。 


5. 4. 3 模糊 控制 器 的 设计 


在 确定 了 模糊 控制 器 的 结构 后 ， 就 要 具体 设计 模糊 控制 器 。 模 糊 控制 器 的 设计 通常 包括 
三 个 方面 的 内 容 : 精确 量 的 模糊 化 处 理 、 建 立 模糊 规则 和 解 模 糊 。 

1. 精确 量 的 模糊 化 处 理 

确定 模糊 控制 器 的 语言 变量 是 设计 模糊 控制 器 的 第 一 步 ， 包 括 输入 语言 变量 与 输出 语言 
变量 的 确定 。 语 言 变量 的 确定 与 控制 器 的 结构 有 关 ， 当 采用 二 维 控制 器 时 ， 通 常 输入 语言 变 
量 就 是 误差 和 误差 的 变化 率 ， 而 将 控制 絮 输 出 的 控制 量 的 变化 作为 输出 语言 变量 。 在 选 定语 
言 变量 后 就 要 确定 语言 变量 值 以 及 其 隶属 度 函 数 。 

(1) 语言 变量 值 的 选取 ”在 对 同类 事物 进行 比较 时 ， 通 常 都 会 将 它们 分 成 几 个 等 级 ， 
这 个 等 级 就 是 语言 变量 值 。 在 评价 学 生 的 学 习 成 绩 时 ， 可 以 用 “ 优 ”“ 良 ”“ 中 ”“ 差 ”来 
描述 ; 在 评价 户外 温度 时 ， 可 以 用 “ 热 ”“ 暧 ”“ 凉 ”“ 冷 ”等 来 描述 ; 在 评价 一 个 物体 的 
体积 时 ， 可 以 用 “大 ”“ 中 ”“ 小 ”等 描述 。 同 样 ， 我们 可 以 用 “ 正 ”(P)、“ 零 ”(2)、 
“ 负 ” (NN) 来 描述 误差 、 误 差 的 变化 率 以 及 控制 量 的 变化 。 如 果 需 要 描述 得 更 准确 ， 还 可 
以 用 “正大 ”(PB)、“ 正 中 ”(PM)、“ 正 小 ”(PS)、“ 零 ”(Z)、“ 负 大 ”(NB)、“ 负 中 ” 
(NM)、“ 负 小 ”(NS) 等 7 个 语言 变量 值 来 描述 。 

一 般 来 说 ， 一 个 语言 变量 的 值 越 多 ， 对 事物 的 描述 越 全 面 、 准 确 ， 可 能 得 到 的 控制 效果 
越 好 ， 但 另 一 方面 ， 划 分 过 细 会 使 模糊 规则 变 得 复杂 ， 制 定时 有 一 定 的 难度 。 因 此 对 语言 变 
量 值 的 选取 要 兼顾 细致 性 与 规则 的 简单 易 行 ， 常 用 的 情况 是 每 个 语言 变量 选择 3~ 10 个 值 ， 
通常 为 (PB，PMH，PS$，0，NB，NMH，NS) 7 个 值 ， 对 于 偏差 的 语言 变量 有 时 还 分 为 “ 正 
零 ”(PO) 与 “ 负 零 ” (NO) 两 个 值 ， 构 成 了 (PB, PM, PS, PO, NO, NB, NM, NS) 


G2D 
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8 值 的 模式 。 

(2) 模糊 集合 论 域 的 选择 ”通常 把 模糊 控制 名 的 精确 量 输入 与 输出 的 实际 范围 称 为 这 
些 变 量 的 基本 论 域 ， 显 然 基本 论 域内 的 量 为 精确 量 。 把 精确 量 模糊 处 理 后 得 到 的 模糊 集 
合 的 论 域 称 为 模糊 集合 论 域 ， 通 常 ， 在 模糊 控制 中 取 为 对 称 的 形式 ， 即 取 模 糊 集合 论 域 
为 | -nn,-n+1,…,0,.…,n-l1,n|。 

对 于 的 选择 ， 从 理论 上 讲 ， 增 加 论 域 中 的 元 素 个 数 即 把 等 级 细 分 ， 可 提高 控制 精度 ， 
但 同时 也 增加 了 计算 量 ， 对 于 模糊 控制 ， 没 有 必要 将 等 级 划分 过 细 。 一 般 来 讲 ， 论 域 中 的 元 
素 个 数 为 模糊 子 集 总 数 的 2 倍 左右 时 ， 模 糊 子 集 对 论 域 的 覆盖 程度 较 好 。 例 如 当 语 言 变 量 选 
为 7 个 时 ， 选 择 n 二 6。 

(3) 语言 变量 值 的 隶属 函数 确定 

语言 变量 值 实 际 上 是 一 个 模糊 子 集 ， 因 此 是 通过 隶属 函数 来 描述 的 。 模 糊 控制 中 隶属 函 
数 类 型 的 选取 没有 统一 的 标准 ， 完 全 取决 于 控制 对 象 的 不 同情 况 、 设 计 者 的 习惯 以 及 处 理 简 
便 程度 等 ， 另 外 不 同 模糊 子 集 的 隶属 函数 可 以 取 为 相同 的 也 可 以 取 为 不 完全 相同 的 。 

一 般 情 况 下 ， 选 择 语言 变量 值 的 隶属 函数 应 注意 以 下 几 点 ; 

1) 隶属 函数 (x) 的 形状 。 隶 属 函 数 的 形状 越 陡 ， 分 辨 率 越 高 ， 控 制 器 的 灵敏 度 越 高 ; 
反之 ,平缓 的 隶属 函数 会 使 控制 器 的 灵敏 度 降 低 。 因 此 在 选择 语言 变量 的 隶属 度 时 ，“ 零 ” 
左右 的 隶属 函数 划分 得 较 细 ， 形 状 较 陡 ， 每 个 模糊 子 集 占 用 的 论 域 段 区 域 较 小 ， 这 是 因为 零 
点 附近 系统 偏差 很 小 ， 这 样 选择 隶属 函数 可 使 控制 器 的 控制 动作 精确 、 细 腻 。 而 在 系统 偏差 
较 大 的 范围 内 模糊 变量 采用 低 分 辩 率 的 隶属 函数 ， 这 样 选择 可 使 系统 有 较 快 的 响应 速度 。 

2) 要 充分 考虑 语言 变量 的 全 部 模糊 集合 对 论 域 [-”, +n] 的 履 盖 程度 ， 应 使 论 域 中 任 
何 一 点 对 这 些 模糊 集合 的 隶属 函数 的 最 大 值 都 不 能 太 小 ， 否 则 这 样 的 点 上 会 出 现 “ 空 档 ”， 
从 而 引起 失控 。 

3) 要 考虑 各 模糊 集合 间 的 相互 影响 。 相 互 影响 可 用 两 个 相 邻 模糊 集合 交集 点 的 隶属 度 
B 来 衡量 ，B 值 越 小 ， 控 制 的 灵敏 度 越 高 ， 但 是 系统 的 稳定 性 变 差 ， 容 易 引 起 系统 波动 ; B 
值 越 大 ， 控 制 对 于 被 控 过 程 的 参数 变化 适应 性 强 ， 和 鲁 棱 性 好 ， 控 制 稳定 性 好 ,但 同时 会 使 系 
统 的 灵敏 度 变 差 。 一 般 取 B=0.4~0.7。 

(4) 语言 变量 赋值 表 的 建立 ”对 模糊 变量 的 隶属 度 函 数 进 行 量化 ， 采 用 量化 后 的 隶属 
度 函 数 是 模糊 控制 器 设计 中 常用 的 方法 之 一 。 假 设 系统 误差 5 的 模糊 语言 值 取 (NB，NM， 
NS,，NO，PO，PS，PM，PB)， 并 取 模 糊 集合 的 论 域 为 [-6，6] ， 其 隶属 函数 的 定义 如 图 
5-6 所 示 。 
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若 将 这 8 





值 分 别 用 -6，-5， 


-4 


要 3 二 








-1,，0,， 1,， 2, 3, 4, $，6 这 13 个 等 


级 来 表示 ， 就 建立 起 了 离散 化 后 的 精确 量 与 模糊 语言 变量 之 间 的 一 种 模糊 关系 。 将 此 关系 用 


表格 的 形式 来 表示 ， 就 是 表 5-1 所 示 i 


五 . 


至 言 变量 的 赋值 表 。 同 样 的 方式 ， 可 以 建立 出 误差 变 


化 率 EC 以 及 输出 量 U0 的 赋值 表 ， 如 表 5-2 及 表 5-3 所 示 。 


























表 5-1 语言 变量 EE 的 赋值 表 
M(x) -6|1-5|-4|-3|-2|-1|0 1 2 3 4 5 | 6 
语言 值 

NB 1.0|08 |04|l01| 0 0 0 0 0 0 0 0 | 0 
NM 0.2107|10|107|02|0 0 0 0 0 0 0 | 0 
NS 0 0 |0o1|05| 10|08|03| 0 0 0 0 0 | 0 
NO 0 0 0 0 lIo1lo6cl10| 0o 0 0 0 0 | 0 
PO 0 0 0 0 0 0 |10|06| 01| 0 0 0 | 0 
PS 0 0 0 0 0 0 |o03| 08 | | 10|05|l01| 0 lon 
PM 0 0 0 0 0 0 0 0 |02|07|10|07|0.2 
PB 0 0 0 0 0 0 0 0 0 |o01|04|08 1.0 





M(x) 


























































































































= 人 | | 4 | | | = 0 1 2 3 4 5 6 
语言 值 
NB 10 | 08 | 04 10.1 0 0 0 0 0 0 0 0 0 
NM 0.2 | 0.7 1 0.7 | 0.2 | 0 0 0 0 0 0 0 0 
NS 0 0 |02107110109%10 0 0 0 0 0 0 
0 0 0 0 0 0 | 0.5 1 0.5 | 0 0 0 0 0 
PS 0 0 0 0 0 0 0 |0911010.7 |102 | 0 0 
PM 0 0 0 0 0 0 0 | 
PB 0 0 0 0 0 0 0 0 0 | OL | Gd Ge 0 
表 5-3 语言 变量 U 的 赋值 表 
Kx) -6 | -5| -4 | -3 | -2 | -i 0 1 2 3 4 5 6 
语言 值 
NB 1.0 | 08 | 04 10.1 0 0 0 0 0 0 0 0 0 
NM 人 ||| 0 0 0 0 0 0 0 
NS 0 |0.1|0.4|108 .10|0.4|0 0 0 0 0 0 0 
0 0 0 0 0 0 | 0.5 1 0.5 | 0 0 0 0 0 
PS 0 0 0 0 0 0 0 |04110108 |10410110 
PM 0 0 0 0 0 0 0 0 | 0.2|0.7 1 0.7 | 0.2 
PB 0 0 0 0 0 0 0 0 0 |0110410811 
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(5) 量化 因子 和 比例 因子 ”量化 因子 和 比例 因子 都 是 为 了 对 清晰 值 进行 比例 变换 而 设 
置 的 ， 其 作用 是 使 变量 按 一 定 比 例 进 行 放大 和 缩小 。 

模糊 控制 器 的 每 一 个 输入 与 输出 信号 都 有 其 基本 论 域 ， 为 了 进行 模糊 推理 ， 我 们 会 给 每 
个 变量 相应 的 模糊 论 域 ， 其 中 基本 论 域 与 模糊 论 域 的 匹配 问题 就 由 量化 因子 来 完成 。 此 外 每 
次 采样 经 模糊 控制 算法 给 出 的 控制 量 还 不 能 直接 控制 对 象 ， 还 必须 将 其 转换 为 控制 对 象 所 能 
接受 的 基本 论 域 ， 而 从 控制 量 的 模糊 集 论 域 到 基本 论 域 的 变换 由 比例 因子 完成 。 

下 面 说 明 一 个 清晰 量 的 模糊 化 过 程 。 

设 系统 误差 e 的 实际 变化 范围 为 [a, 5]， 在 某 时 刻 得 到 的 。 的 精确 值 为 x， 则 其 模糊 
化 过 程 为 

1) 将 [a, 5] 区 间 的 精确 量 x 转化 为 [-n, n] 区 间 的 变量 y， 其 变换 式 为 


-| 畦 | 
1 ja “2 


2 y 六 了 口 YI 
{中 ， k= 即 为 误差 信号 e 的 量化 因子 ,特别 地 ， 当 a=-5(5>0) 时 y= xh 
-a 


2) 对 y 四 侈 五 人 取 整 得 到 y* ， 在 表 5-1 中 y* 所 在 的 列 中 寻找 最 大 隶属 度 值 ， 则 该 最 
大 隶属 度 所 对 应 的 语言 值 就 是 精确 输入 量 * 的 模糊 化 结 

例如 某 控制 系统 误差 。 的 实际 变化 范围 为 [-2，2],， 在 某 时 刻 得 到 的 。 的 精确 值 
、 、 、 加 12 2+( -2) 
为 -0.76, 转化 为 [-6, 6] 区 间 的 变量 y= 元 过 
四 舍 五 人 得 到 -2， 在 表 5-1 中 ，-2 所 对 应 的 隶属 度 分 别 为 0.2(NM)、1(NS)、0.1(NO)， 
其 中 ， 属 于 模糊 集合 NS 的 隶属 度 最 大 为 1， 因此 ， 精 确 值 -0. 76 的 模糊 化 结果 就 是 NS。 

2. 模糊 规则 及 模糊 规则 表 

模糊 规则 是 根据 专家 知识 以 及 操作 人 员 的 长 期 经 验 积 累 而 来 的 ， 通 常 是 由 一 系列 的 模糊 
条 件 语句 组 成 ， 即 由 许多 模糊 蕴含 关系 “如 果 …… 那 么 ……” (if…then…) 构成 。 比 如 我 
们 根据 经 验 可 以 知道 ， 如 果 系 统 的 实际 输出 值 大 于 期 望 值 ， 那 么 此 时 需要 减 小 控制 器 的 输出 
来 减 小 实际 输出 ， 从 而 减 小 误差 。 如 果 我 们 将 误差 表示 为 = 实际 值 - 期 望 值 ， 那 么 ,误差 
下 为 正 时 ， 控 制 器 的 输出 就 应 该 减 小 ， 并 且 五 为 正 值 越 大 ， 控 制 器 的 输出 减 小 得 越 多 ; 误差 
为 负 时 ， 控 制 器 的 输出 就 应 增加 ; 误差 为 零 时 ， 控 制 器 的 输出 不 变 。 

当 将 系统 的 误差 以 及 误差 的 变化 率 作 为 输入 变量 时 ， 经 过 大 量 的 实际 经 验 的 总 结 ， 得 到 
下 述 26 条 模糊 条 件 语句 : 





























MN 














]=-0.76x3=-2.28, 将 -2.28 











(1) i FE=NB and EC=NB or NM or NS or O then U=PB 
(2) i FE=NB and EC=PS or PM or PB then V=O 

(3) FE=NM and EC=NB or NM then U=PB 
(4) i FE=NM and EC=NS or O then U= PM 
(5) i FE=NM and EC=PS then U=PS 
(6) i FE=NM and EC=PM or PB then V=O 

(7) EFE=NS and EC=NB then U=PB 
(8) i FE=NS and EC=NM then U= PM 
(9) ff E=NS and EC=NS or O then U=PS 
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(10) i FE=NS and EC=PS or PM or PB then V=O 
(11) i FE=NO and EC=NB then U= PM 
(12) i EF=NO and EC=NM then U=PS 


(13) i FE=NO and EC=NS or O or PS or PM or PB then U=0 


(26) i EF=PB and EC=NS or NM or NB or O then U=NB 
根据 (1) ~(13) 条 规则 ， 不 难 写 出 后 面 (14) ~ (26) 条 规则 。 将 此 26 条 语句 列 成 模 
糊 控制 表 如 表 5-4 所 示 。 
表 5-4 ”模糊 控制 表 















































E 
0 NB NM NS NO PO PS PM PB 
EC 
NB PB PB PB PM 0 0 0 0 
NM PB PB PM PS 0 0 0 0 
NS PB PM PS 0 0 0 NS 0 
0 PB PM PS 0 0 NS NM NB 
PS 0 PS 0 0 0 NS NM NB 
PM 0 0 0 0 NS NM NB NB 
PB 0 0 0 0 NM NB NB NB 
3. 模糊 推理 





表 5-4 中 提供 了 56 条 形 如 “if 4 and B then C” 的 模糊 规则 ， 由 5. 3.1 节 可 知 ， 该 规则 
确定 了 一 个 三 元 模糊 关系 R=4xBxC。 例 如 根据 第 一 条 规则 “if =NB and EC=NB then U= 
PB”， 可 得 到 三 元 模糊 关系 

RI =NB,; XNBEexPB, 
其 中 根据 表 5-1~ 表 5-3， 有 
1 ,0.8 0.4 0. 1 NB 1 0.8 0.4 0， 1 pp,=0 1 .0.4 .08 1 
-6 -5 -4 -3 -6 -5 -4 -3 3 4 5 6 

同 理 ， 根据 56 条 规则 ， 我 们 得 到 56 个 模糊 关系 R,(i=1…56)， 将 此 56 个 模糊 关系 做 

并 运算 ， 构 成 总 的 模糊 关系 
R=RI UR,U-. UR =UR 

建立 了 系统 的 模糊 关系 后 ， 我 们 可 以 进行 模糊 推理 。 给 定 模 糊 控制 器 输入 语言 变量 
论 域 上 的 模糊 子 集 E 和 EC， 即 可 根据 模糊 合成 U= (ExEC)。R 求 出 其 输出 语言 变量 论 域 
上 的 模糊 集合 U， 具 体 计算 方法 见 5.3 节 。 

4. 解 模糊 
通过 以 上 模糊 推理 我 们 可 以 得 到 模糊 的 输出 量 ， 但 是 模糊 系统 最 终 送 给 执行 机 构 的 是 一 
个 清晰 量 ， 因 此 ， 需 要 将 模糊 量 转化 为 清晰 量 ， 这 就 是 解 模糊 所 要 完成 的 任务 ， 和 常用 的 方法 
主要 有 以 下 几 种 : 

(1) 最 大 隶属 度 法 ” 亦 称 直接 法 ， 该 方法 直接 选择 输出 模糊 集合 的 隶属 度 函 数 峰 值 作 


NB = 











oO 
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为 输出 的 确定 值 。 如 果 输 出 模糊 集合 的 隶属 函数 只 有 一 个 最 大 值 ， 就 直接 取 该 隶属 函数 的 最 
大 值 为 清晰 值 ， 如 果 模 糊 集合 众多 个 元 素 同 时 出 现 最 大 隶属 函数 值 ， 就 取 其 平均 值 作为 清 
晰 值 。 
【 例 5-13】 已 知 输 出 量 所 对 应 的 模糊 向 量 为 
» 0.2 0.5 0.8 0.4 0.1 
UT = 一 一 二 一 一 十 一 一 十 一 一 十 
-3 -2 -1 0 1 
0.2 0.6 0.6 0.6 0.1 
= 十 一 一 十 十 一 一 十 
1 2 3 4 5 














Uz 





利用 最 大 隶属 度 法 分 别 求 得 
Ui=-1 


1 
U, = 3 


(2) 重心 法 “这 种 方法 也 称 为 质心 法 或 面积 中 心 法 ， 是 所 有 解 模糊 化 方法 中 最 为 合理 
的 方法 。 该 方法 的 数学 表达 式 为 


2 Ne) 7 
这 Se 
了 n 
Dryi) 
;=1 


【 例 5-14】 利用 重心 法 将 例 5-13 的 输出 量 解 模糊 得 
Dy _0. 2x(—3)+0. 5x(—2)+0. 8x(—1)+0.4x0+0. 1x1_ -2 过 15 
0.2+0. 5+0. 8+0. 4+0. 1 2 
由 -0.2x1+0. 6x2+0. 6x3+0. 6x4+0. 1x5 _6.1,, 
< 0.2+0. 6+0. 6+0. 6+0. 1 2.1 

5. 模糊 查询 表 的 建立 

在 模糊 控制 的 运行 过 程 中 ， 首 先 将 模糊 控制 器 的 精确 输入 信号 。 与 ec 模糊 化 ， 然 后 利 
用 模糊 关系 进行 模糊 推理 得 到 模糊 输出 量 ， 再 对 模糊 输出 量 解 模糊 化 为 精确 输出 量 ， 最 后 利 
用 比例 因子 将 其 变换 到 控制 量 的 基本 论 域 中 ， 完 成 对 被 控 对 象 的 一 次 控制 。 

例如 ， 模 糊 控制 器 的 输入 信号 e 与 ec 在 经 量化 因子 转化 后 分 别 为 下 =+4、EC=-1。 
=+4 时 查 语言 变量 表 5-1 可知， 在 +4 级 上 对 应 的 隶属 度 有 0.1(PS)、1(PM)、0.4(PB) 
共 三 个 非 零 量 ， 其 中 PM 最 大 隶属 度 为 1， 此 时 对 应 的 语言 变量 为 PM; 同样 的 方式 可 以 通 
过 表 5-2 查 得 EC=-1 时 最 大 隶属 度 所 对 应 的 语言 变量 为 NS。 因 此， 输入 模糊 化 后 为 =PM 
and EC=NS， 则 利用 模糊 关系 R 进行 模糊 合成 后 得 到 

U= (PMXNSge) oR 
最 后 ， 将 模糊 量 U 解 模糊 得 到 精确 值 -3。 

这 样 ， 每 给 一 对 与 EC 的 值 ， 都 可 以 按照 上 述 方法 得 到 一 个 过 的 值 (E、EC 以 及 U 
的 论 域 均 为 1-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,61 ) 。 根 据 不 同 的 已 以 及 EC 的 等 级 计算 出 
相应 的 控制 量 VU， 制 成 如 表 5-5 所 示 的 控制 表 。 当 进行 实时 控制 时 ， 根 据 模 糊 化 后 的 控制 器 
的 输入 量 信息 ， 直 接 从 表 中 查询 所 需 采 取 的 控制 策略 即 可 。 因 此 ， 该 表 又 被 称 为 模糊 查询 
表 。 利 用 模糊 查询 表 ， 可 以 不 再 重复 模糊 推理 过 程 ， 大 大 提高 了 信息 的 处 理 速度 。 








2.9 
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表 5-5 模糊 查询 表 






























































E 
0 -6 -5 -4 三 3 一 2 =] -0 0 1 2 3 4 所 ] 6 
EC 
-6 6 5 6 S. 3 3 3 3 2 1 0 0 0 0 
-5 5 5 5 3 3 3 3 3 2 1 0 0 0 0 
一 人 6 9 6 5 3 3 3 3 2 1 0 0 0 0 
=3 3 3 3 5 4 4 4 4 2 -1 -1 -1 一 1 一 1 
一 2 6 9 6 5 3 3 1 1 0 0 -2 =3 =3 =3 
一 1 6 3 6 5 3 3 1 1 0 -2 =2 =3 =3 =3 
0 3 3 6 5 3 1 0 0 一 1 =3 -5 -6 =5 -6 
1 3 3 3 2 0 0 0 0 =3 -3 -3 -6 =5 -6 
2 1 3 3 1 0 0 -1 el -3 三 和 = -6 =3 -6 
3 0 1 1 0 0 0 -1 一 1 =2 -2 = =5 =5 = 
4 0 0 0 = 一 1 -2 -3 =3 =3 =3 -5 -6 =5 -6 
3 0 0 0 一 1 一 1 =2 =3 =3 =3 =3 =5 = = = 
6 0 0 0 = 一 1 一 1 -3 =3 =3 =3 -5 -5 =5 -6 























5.4. 4 ”模糊 PID 控制 器 的 设计 


在 常规 的 模糊 控制 系统 中 ， 由 于 模糊 控制 器 实现 的 简易 性 和 快速 性 ， 往 往 采用 二 维 模糊 
控制 融 的 形式 。 这 类 控制 器 都 是 以 误差 和 误差 变化 率 作 为 输入 变量 ， 类 似 于 常规 的 比例 - 微 
分 控制 作用 ， 可 以 获得 良好 的 动态 性 能 ， 但 其 稳 态 控制 精度 较 差 ， 控 制 从 细腻 ， 难 以 达到 较 
高 的 精度 ， 特 别 是 在 平衡 点 附近 存在 着 盲区 。 

设 系统 误差 信号 e 的 实际 论 域 为 =[ -a,a] ， 模 糊 值 的 模糊 论 域 为 Y=| -n,n+1,…， 
-1, 0, 1,…,n+1,n| 时 ， 由 量化 因子 定义 可 知 ， 量 化 因子 为 k=n/a。 在 |ke|<n 情况 下 ， 
模糊 值 可 由 取 整 公式 





|E|=int( |ke|+0. 5) 
算出 ， 即 y 为 fe 四 售 五 人 后 的 整数 ， 其 符号 与 e 的 符号 相同 。 由 上 式 可 知 ， 在 平衡 点 附近 ， 
即使 e 和 关 0，y 也 有 可 能 为 0。 

例如 ， 假 设 实际 论 域 中 偏差 的 最 大 值 a= 1. 5， 模 糊 集合 论 域 中 n=6，, 由 0=int (|4e|+ 
0.5) 可 知 ， 当 |4e|<0.5， 即 |e|<0. 125 时 ， 模 糊 化 之 后 的 模糊 语言 值 都 为 零 。 根 据 模糊 查 
询 表 ， 如 果 天 为 0， 则 相应 的 控制 量 输出 为 0， 也 就 意味 着 ， 当 |e|<0. 125 时 ， 在 该 模糊 控 
制 系 统 中 已 被 视 为 没有 误差 。 这 个 平衡 点 附近 的 区 域 ， 称 为 盲区 或 死 区 。 由 于 盲区 的 存在 ， 
模糊 控制 无 法 消除 静态 误差 。 

我 们 知道 在 传统 的 PID 控制 中 ， 积 分 控制 作用 可 以 有 效 地 消除 静态 误差 。 因 此 ， 把 PID 
控制 策略 引入 到 模糊 控制 器 中 ， 构 成 模糊 一 PID 复合 控制 ， 可 以 将 模糊 控制 器 的 鲁 棒 性 与 
PID 控制 器 在 稳 态 方面 的 优势 相 结合 ， 以 使 控制 效果 更 加 完美 。 下 面 是 几 种 模糊 与 PID 控制 
的 结合 方式 。 
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1. 模糊 一 Pl 控制 器 
为 了 利用 模糊 控制 絮 的 鲁 棒 性 以 及 较 好 的 动态 特性 ， 又 能 弥补 模糊 控制 如 平衡 点 附近 的 


盲区 问题 ， 引 入 PI 环节， 与 模糊 控制 器 
构成 模糊 一 PI 复合 控制 器 ， 如 图 57 ， 。 懂 
所 示 1 a me 

se — 


由 图 可 知 ， 在 误差 信号 之 后 ， 设 置 
了 一 个 带 有 阔 值 的 模 态 转换 器 ， 根 据 阅 
值 与 e 的 比较 结果 确定 模 态 : 当 。 大 于 冰 pe 
值 时 ， 信 号 进入 模糊 控制 器 ， 以 获得 良 
好 的 动态 性 能 ， 若 。 小 于 阔 值 ， 信 号 则 进入 PI 控制 器 ， 以 获得 良好 的 稳 态 性 能 。 这 种 模 
糊 一 PI 控 制 器 ， 比 单个 的 模糊 控制 器 具有 更 高 的 稳 态 精度 ， 可 以 消除 盲区 ;同时 比 经 典 的 
PI 控制 具有 更 快 的 动态 响应 性 能 ， 系 统 能 很 快 趋 近 于 平衡 点 。 

类 似 的 复合 控制 器 还 有 多 种 ， 其 基本 出 发 点 都 是 利用 PID 控制 的 特点 ， 提 高 模糊 控制 
器 的 控制 精度 和 跟踪 性 能 。 

图 5-8 给 出 了 一 种 P 一 模糊 一 PI 复合 控制 器 。 当 误差 信号 。 大 于 阔 值 时 ， 用 比例 控制 ， 
可 以 提高 系统 的 响应 速度 ， 加 快 响应 过 程 ， 当 偏差 减 小 到 阔 值 以 下 时 ， 切 换 到 模糊 控制 ， 以 
提高 系统 的 阻尼 性 能 ， 减 小 响应 过 程 中 的 超 调 ， 根 据 前 面 的 分 析 ， 当 模糊 语言 值 为 “0" 
时 ， 其 实际 误差 。 并 不 一 定 为 0， 因 此 ， 在 更 小 的 范围 内 (误差 变量 模糊 化 之 后 的 模糊 语言 
值 为 0 时 ) 使 用 PI 控制， 以 此 来 消除 稳 态 误差。 


EE 
mi 
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OO 
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图 5-8 P 一 模糊 一 PI 控制 器 结构 图 
比例 控制 e>A 

控制 开关 = 1 模糊 控制 A'<e<A 

PI 控制 。 e<A!' 





2. 自 整 定 模 糊 一 PID 控制 器 

常规 的 PID 控制 器 具有 简单 易 用 、 稳 定性 好 、 可 靠 性 高 等 特点 ， 是 当前 应 用 最 为 广泛 
的 一 类 控制 缮 ， 它 对 于 各 种 线性 定常 系统 的 控制 ， 都 能 够 获得 满意 的 控制 效果 。 但 是 ， 由 于 
生产 过 程 中 存在 着 非 线 性 、 干 扰 等 复杂 因素 ， 要 获得 满意 的 控制 效果 ， 就 需要 对 PID 参数 
进行 不 断 地 在 线 调整 。 有 时 由 于 这 些 参数 变化 无 常 ， 没 有 确定 的 规律 可 循 ， 常 规 的 PID 控 
制 不 具有 实时 调整 参数 的 功能 ， 从 而 影响 其 控制 效果 的 进一步 提高 。 

离散 系统 PID 控制 的 基本 规律 为 


大 一 1 
U(k)= Ke(k) + Ki De(i) + Kp[e(k) -eGE -1)] 
i=0 
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式 中 ,，U(E) 0 e(k) 为 第 个 采样 时 刻 控制 器 的 输入 ( 即 
误差 信号 ); K, 、Ki;、Ky 分 别 为 比例 、 、 微 分 系数 。 

利用 模糊 控制 的 重 棒 人 性， 对 PID 可 有 效 解 决 上 述 问题 ， 
这 种 基于 模糊 理论 的 PID 控制 器 称 为 自 整 定 模糊 一 PID 控制 器 。 自 整定 模糊 一 PID 控制 器 以 
误差 和 误差 变化 率 EC 作为 输入 ， 其 结构 图 如 图 5-9 所 示 。 


模糊 推理 





















dt ec 








图 5-9 自 整 定 模糊 一 PID 控制 系统 结构 图 


通过 大 量 的 操作 经 验 可 知 ，PID 控制 器 的 三 个 参数 K,。 、Ki1 、Ko 与 误差 。 以 及 误差 变化 
量 ec 之 间 存 在 着 一 种 非 线 性 关系 ， 这 些 关系 虽然 无 法 用 数学 表达 式 表 示 ， 但 却 可 以 用 模糊 
语言 来 描述 。 

1) 当 |e| 较 大 时 ， 为 加 快 系统 的 响应 速度 ， 应 取 较 大 的 K,， 这 样 可 以 使 系统 的 时 间 常 
数 和 阻尼 系数 减 小 ， 当 然 Kp 不 能 取得 过 大 ， 否 则 容易 造成 系统 的 不 稳定 ; 为 了 避免 在 系统 
开始 时 可 能 引起 的 超 范围 的 控制 作用 ， 应 取 较 小 的 Ks， 以 便 加 快 系统 响应 ;为 避免 出 现 较 
大 的 超 调 ， 此 时 可 去 掉 积 分 作用 ， 取 后 =0 

2) 当 |e| 为 中 等 大 小 时 ， 应 取 较 小 的 K,， 使 系统 响应 的 超 调 略 小 一 点 ;此 时 Ky 的 取 
值 对 系统 较为 关键 ， 为 保证 系统 的 响应 速度 ，K 的 取 值 要 恰当 ， 此 时 可 适当 增加 一 点 Ki， 
但 不 得 过 大 。 

3) 当 |e| 较 小 时 ， 为 使 系统 具有 良好 的 稳 态 性 能 ， 可 取 较 大 的 Kp 和 Ki; 为 避免 系统 在 
平衡 点 出 现 振荡 ， 并 考虑 系统 的 抗 干扰 特性 ， 当 |ec | 较 小 时 ，K 值 可 取 大 些 ， 通常 取 为 中 
等 大 小 ; 当 |ec | 较 大 时 ，Ko 值 应 取 小 些 。 

基于 以 上 总 结 的 输入 变量 。 与 三 个 参数 K, 、Ki;、Ko 的 定性 关系 ， 考 虑 到 误差 变化 量 ec 
的 影响 ， 结 合 实际 操作 经 验 ， 综 合 得 到 调整 PID 控制 器 三 个 参数 的 模糊 规则 ， 如 表 5-6~ 表 




















5-8 所 示 。 
表 5-6 AHKp 控制 规则 表 表 5-7 AN 控制 规则 表 
本 |e| 有 |e| 
B M S 0 " B M Ss 0 
|ec | | ec | 

B M S M M Bb 0 S M B 
M Bb M Bb Bb M 0 S Bb B 
S Bb M Bb B S 0 S B B 
0 B M B 0 0 0 0 B 0 
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表 中 B、M、S、0 分 别 对 应 语言 变量 表 5-8 AKo 控制 规则 表 
“he “EE” “7 “ 零 ”， 模糊 子 集 的 隶属 也 AK |e| 
数 常 取 简单 的 三 角形 和 梯形 。AKp、AKi、 I 


AK, 分 别 为 PID 控制 器 原来 设计 参数 K,、 “| 
后 、j 的 修正 值 ， 系 统 实时 的 参数 取 值 应 该 
分 别 为 Kp+AKp、Ki+AK!、Kp+AK,。 

如 图 5-9 所 示 ， 自 整定 模糊 一 PID 控制 
器 将 输入 PID 控制 器 的 误差 。 及 误差 变化 量 0 |2312 13 10 
ee 经 模糊 化 后 同时 给 模糊 推理 模块 ， 经 过 推理 得 到 PID 控制 器 参数 的 修正 值 AK, 、AK 、 
AK。， 将 修正 值 输 入 到 PID 控制 器 ， 对 其 三 个 参数 进行 在 线 修正 ， 能 更 好 地 利用 其 动态 性 能 
进行 实时 调节 ; 特别 是 在 控制 对 象 或 环境 出 现 不 确定 性 、 干 扰 等 因素 时 ， 利 用 模糊 控制 器 ， 
充分 结合 操作 人 员 进 行 实时 非 线性 调节 的 成 功 实践 操作 经 验 ， 发 挥 PID 控制 器 的 优良 控制 
作用 ， 使 整个 系统 达到 最 佳 的 控制 效果 。 


5.5 模糊 聚 类 分 析 与 模糊 模式 识别 


分 类 识别 是 人 类 最 重要 的 基本 活动 之 一 ， 在 人 类 的 日 常生 活 、 社 会 活动 、 科 研 生产 以 及 
学 习 、 工 作 中 无 时 无 处 不 在 进行 着 分 类 识别 。 例 如 ， 儿 童 在 认 读 字母 卡片 上 的 字符 时 ， 将 它 
们 区 分 为 A~Z 中 的 一 个 ， 这 是 对 字符 的 识别 ; 在 阅读 时 人 们 进行 的 是 文字 识别 活动 ; 在 听 
力 测 试 时 人 们 进行 着 语音 识别 活动 。 医 生 诊 断 疾病 时 需要 对 病情 进行 识别 。 随 着 人 类 社会 活 
动 的 发 展 ， 需 要 识别 的 对 象 和 种 类 不 断 增多 ， 内 容 越 来 越 复杂 和 深入 ， 要 求 也 越 来 越 高 。 为 
了 满足 人 类 社会 发 展 的 需求 ， 模 式 识别 技术 得 到 了 迅速 发 展 。 

根据 分 类 前 类 别 的 确定 程度 ， 分 类 识别 可 分 为 模式 识别 和 聚 类 分 析 两 类 。 在 进行 识别 
时 ， 如 果 已 预先 知道 若干 个 标准 的 模式 (类 )， 再 决定 某 一 待 分 的 对 象 应 归于 哪 一 类 ， 这 种 
识别 就 属于 模式 识别 。 而 如 果 事 先 并 不 知道 一 组 待 分 的 对 象 应 划分 为 几 类 ， 没 有 任何 模式 可 
供 参考 就 要 完成 分 类 ， 则 这 种 识别 就 属于 上 聚 类 分 析 。 也 就 是 说 ， 聚 类 分 析 是 无 参考 模式 的 分 
类 ， 模 式 识别 是 有 参考 模式 的 分 类 。 因 此 ， 聚 类 分 析 是 更 基础 的 工作 。 只 有 上 先 通过 聚 类 分 析 
才能 形成 类 (模式 ) ， 然 后 才能 再 进一步 进行 模式 识别 。 例 如 ， 在 天 气 预报 中 ， 人 们 就 是 将 
已 知 的 各 种 天 气 样本 先进 行 聚 类 分 析 分 成 若干 类 型 ， 从 而 得 到 天 气 模 式 ， 然 后 再 对 有 待 预报 
的 天 气 进 行 模式 识别 ， 如 果 它 属于 阴雨 那 一 类 ， 即 可 预报 将 要 下 雨 ， 从 而 进行 天 气 预报 。 聚 
类 分 析 、 模 式 识 别 与 预报 的 关系 可 用 图 5-10 来 表示 。 


待 分 类 (预报 ) 的 样本 


图 5-10” 聚 类 分 析 、 模 式 识 别 与 预报 的 关系 图 


模式 识别 与 聚 类 分 析 都 是 根据 对 象 的 特征 完成 分 类 任务 的 ， 具 体 的 方法 有 许多 种 。 如 果 
对 象 的 特征 是 “ 软 约束 ”， 即 具有 模糊 性 ， 则 在 其 基础 上 进行 的 模式 识别 与 聚 类 分 析 就 是 模 
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糊 模 式 识 别 与 模糊 聚 类 分 析 。 
模糊 模式 识别 与 模糊 聚 类 分 析 的 方法 也 有 许多 种 ， 本 书 主要 介绍 传递 团 包 法 的 模糊 聚 类 
分 析 和 贴近 度 法 的 模糊 模式 识别 两 种 简单 的 方法 。 


5. 5. 1 模糊 聚 类 分 析 


模糊 聚 类 分 析 主 要 是 根据 个 体 之 间 的 相似 度 的 大 小 来 实现 的 。 这 里 ， 先 了 解 模 糊 关 系 的 
几 个 基本 性 质 。 

【定义 5-5】 自 反 性 : 设 R 是 X 中 的 模糊 关系 ， 奉 对 于 VxeX， 都 有 r(x,x)= 1， 则 
称 RR 具 有 自 反 性 ， 为 上 的 自 反 关系 。 

具有 自 反 性 的 模糊 关系 矩阵 的 对 角 线 元 素 均 为 1。 例如 尺 表 示 “ 几 乎 相等 "。 

【定义 5-6】 对 称 性 : 设 尺 是 式 中 的 模糊 关系 ， 若 对 于 Vv，zeX， 有 Hp(u)= Wr(v， 
u) ， 则 称 尺 具有 对 称 性 ， 为 和 上 的 对 称 关系 。 

当 尺 具有 对 称 性 时 ，RTI =R。 例 如 RR 表示 “几乎 相等 ”或 “相差 很 多 ”。 

【定义 5-7】 传递 性 : 设 RR 是 XX 中 的 模糊 关系 ， 若 有 ReRCR， 则 称 R 具有 传递 性 ， 为 
全 上 的 传递 关系 。 

传递 性 表示 R 与 R 的 合成 仍 有 关系 尺 。 例 如 RR 表示“ 大 于 ”。 

【定义 5-8】 传递 闭 包 : R 的 传递 闭 包 尺 定 义 为 ; 

R=RUR UUR"U.= UR" 

RR 的 传递 闭 包 是 包含 RR 而 又 被 任 一 包含 RR 的 传递 矩阵 所 包含 的 传递 矩阵 ， 或 者 说 是 包 
含 RR 的 最 小 的 传递 矩 阵 。 

【定理 5-1】 任何 模糊 关系 (不论 它 是 否 具 有 传递 性 ) 的 传递 闭 包 均 有 传递 性 。 

【定理 5-2】 若 尺 为 有 限 论 域 X= jx ,x,,…, x | 中 的 模糊 关系 ， 则 RR 的 传递 闭 包 为 有 














限 项 的 并 。 
【定理 5-3】 若 RR 为 有 限 论 域 X=|x), x,…, x,| 中 的 相似 模糊 关系 ， 则 对 任意 k=n 
均 有 R=R*。 


由 上 述 定理 可 得 到 一 种 计算 相似 矩阵 传递 闭 包 的 简捷 方法 : 
R—R2 Rt RY =R ,2 cn<2, Bh kh-1<log nh 

上 述 方法 称 为 平方 法 ， 利 用 该 方法 至 多 需要 [logpn]+1 步 就 可 得 到 传递 闭 包 。 其 中 
[x] 为 取 整 操作 ， 即 表示 不 大 于 x 的 最 大 整数 。 

【定义 5-9】 等 价 模糊 关系 : 设 RR 是 X 中 的 模糊 关系 ; 否 R 同时 满足 自 反 性 、 对 称 性 
和 传递 性 ， 则 称 RE 为 模糊 等 价 关 系 ; 奉 民 为 模糊 矩阵 ， 则 称 R 为 模糊 等 价 矩 阵 。 

【定理 5-4】 R 为 等 价 矩 阵 当 且 仅 当 对 任意 As [0,1] ，R, 都 是 等 价 布尔 和 矩阵， 即 普 通 
的 等 价 关系 矩阵 。 

普通 等 价 关系 矩阵 决定 一 个 分 类 ， 彼 此 等 价 的 元 素 同 属于 一 类 。 

【定义 5-10】 分 类 : 所 谓 上 的 一 个 分 类 是 指 可 将 过分 成 者 干 个 子 集 14,1zs 7 ， 使 得 
ANMA,=®D, sz1, s,tel,; UA=U 

【定理 5-5】 若 0 大 MA<w% 和 1， 则 尺 . 所 分 出 的 每 一 个 类 必 是 RR 所 分 出 的 某 一 类 的 子 类 ， 
即 R, 的 分 法 比 及 的 分 法 更 细 。 
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模糊 聚 类 分 析 的 步骤 如 下 : 

Stepl 建立 分 析 对 象 间 的 相似 关系 ; 

Step2 将 上 述 相似 关系 转化 为 等 价 关系 ; 

Step3 建立 聚 类 的 动态 聚 类 图 ; 

Step4 根据 选 定 的 冰 值 确定 分 类 。 

下 面 结合 一 个 具体 的 实例 对 聚 类 过 程 进行 说 明 。 

【 例 5-15】 环境 单元 的 污染 状况 由 空气 污染 度 、 水 分 污染 度 、 土 壤 污 染 度 和 作物 污染 
度 四 个 要 素 进 行 描述 。 设 五 个 环境 单元 的 污染 情况 如 表 5-9 所 示 : 

表 5-9 五 个 环境 单元 的 污染 情况 表 








环境 单元 名 称 空气 污染 度 水 分 污染 度 土壤 污染 度 作物 污染 度 
加 5 5 3 2 
uy 2 3 4 5 
us 5 5 2 3 
ua 1 5 3 1 
us 2 4 5 1 














试 根据 上 述 数 据 实现 五 个 环境 单元 的 模糊 聚 类 分 析 。 
解 : 取 论 域 为 V= ja 四 其 中 履 =[xziy xia，xi3， Yim]。 本 例 中 n=5,， m=4。 
建立 U 中 元 素 的 相似 关系 矩阵 怀 =[7;],x,。 相 似 关 系 的 确定 方法 有 许多 种 ， 总 的 原则 就 
是 与 w 越 相似 ,rj 就 越 大 , 且 0<rj<1。 对 于 具体 问题 可 根据 实际 情况 来 选取 合适 的 一 
种 ， 常 用 的 方法 有 : 
(1) 相关 系数 法 
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El ap -了 
k=1 k=1 


1 m 1 m 
式 中 ,x; =— Dra; 和 = 一 2 x o 
k=1 ME=1 


m 


(2) 夹 角 余弦 法 














(3) 绝对 值 减 数 方法 


Sa 


A 


” |1-e> Ix 一 sx 站 | 让 天 7 
k=1 
(4) 主观 评定 法 
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由 专家 或 分 类 者 进行 打分 确定 。 


本 例 选择 方法 3， 建 立 U 中 元 素 的 相似 关系 ( 取 c=0.1)， 得 相似 矩阵 R。 





Ul Uy 13 





利用 平方 法 求 其 传递 闭 包 

1 
0.3 
R?=|0.8 
0.5 
[0.5 
Tr 1 
0.4 
R4=|0.8 
0.5 
[0.5 
Tr 1 
0.4 
Rs=|0.8 
0.5 
[0.5 





由 于 R=R?， 因 此 R" 就 是 所 求 传递 闭 包 算 阵 。 


Tr 1 0.1 
0.1 1 
i0.8 0.1 1 0.3 
0.5 0.2 0.3 
[0.3 0.4 0.1 


Ua 


0.8 0.5 


0.1 0.2 


1 
0.6 


Us 


0.3 
0.4 
0. 1 
0.6 


0.3 0.8 0.5 
0.4 
0.5 


1 0.2 
0.2 1 
0.4 0.5 
0.4 0.3 
0.4 0.8 

1 0.4 
0.4 1 
0.4 0.5 
0.4 0.5 
0.4 0.8 

1 0.4 
0.4 1 
0.4 0.5 
0.4 0.5 


令 人 由 1 降 至 0,， 求 出 尺 ， 按 尺 分 类 。 


Ri = 





1 


i 


0 
0 
0 


Ls = 


0 0 





1 


0.6 
0.5 
0.4 
0.5 


1 


0.6 
0.5 
0.4 
0.5 


1 


0.6 


Le 





oS 


| 


1 


当 7=1 时 ,i 与 j 归 为 同一 类 。 相 应 的 分 类 结果 为 |u| 、{u| 
也 就 是 说 ， 当 要 求 同 类 的 环境 单元 完全 相似 时 ， 上 述 五 个 环 





一 类 。 
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单元 


口 


~ 


| 
和 


U3 、 | 人 list 


bE 分 成 五 类 ， 即 各 成 
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。 也 就 是 说 ， 当 要 求 同 类 的 环境 单元 相 
成 一 类 。 








相应 的 分 类 结果 为 fu ,ws)}、{uz) 、{ua) 、lus| 

似 度 为 0.8 以 上 时 ,wl 和 ws 可 聚 为 一 类 ， 其 他 三 个 各 
0 
0 
0 
1 
1 


Ro 6= 


Ln 


其 
[1 
0 
1 
0 
[0 





1 
相应 的 分 类 结果 为 ju ,xz 、Eus| 、|Ews、us|。 也 就 是 说 ， 当 只 要 求 同 类 的 环境 单元 相 
似 度 为 0.6 以 上 时 ， ul 和 wu 可 聚 为 一 类 ， us 和 us 聚 为 一 类 ， 刀 仍 单独 成 为 一 类 。 





[1 0 1 11 
0 1000 
Ros=|1 0 1 11 
1 0 1 11 
[101 11 
相应 的 分 类 结果 为 ui ,yx 、| wus。 当 要 求 同 类 的 环境 单元 相似 度 为 0.5 以 上 


时 ,wj 、w3、w4 和 ws 可 限 为 一 类 ，w, 仍 单独 成 为 一 





类 。 
[1 1 1 1 1 
1 1 1 1 1 
Ros=l1 1 111 
1 1 1 1 1 
[|1 11911 
此 时 相应 的 分 类 结果 为 | ui yz ,ws ,ua,us|。 当 要 求 同 类 的 2 
环境 单元 相似 度 为 0.4 以 上 时 ， 所 有 的 环境 单元 就 都 聚 为 ! | | 
类 了 。 08 
上 述 过 程 可 用 如 下 动态 聚 类 图 表示 。 
具体 的 分 类 由 最 后 选 定 的 阔 值 确定。 os 




















5. 5.2 ”模糊 模式 识别 Wt ] 

模糊 模式 识别 通常 分 为 两 类 : 个体 模 式 识别 和 群体 模式 识 “ 
别 。 个 体 模式 识别 是 要 确定 一 个 给 定 的 个 体 属于 哪 一 类 ; 群体 。 图 5 劲 态 困 类 图 
模式 识别 则 是 要 确定 一 组 对 象 属 于 哪 一 类 。 本 书 介绍 的 模糊 模式 识别 实现 的 依据 是 贴近 度 和 
择 近 原则 。 

【定义 5-11】 贴近 度 是 UxUV 上 的 一 个 模糊 关系 oo， 它 具有 下 列 性 质 : 

1) 自 反 性 : o(4,4)=1 

2) 对 称 性 : o(4,B)=o(B,A) 二 0 

3) 阁 VueU 有 WKaKc， 或 4 二 Kp 宇 Kc， 则 有 

o(B,C)<o(A,C) 

贴近 度 反 映 的 是 两 个 模糊 集合 的 贴近 (相似 ) 程度 ，o 越 接 近 1， 两 个 模糊 集合 越 

相似 。 
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【定义 5-12】 择 近 原则 : 符 有 个 模式 4A; ，A,，…，A4,,， 对 待 识别 (分类) 的 对 象 B， 
车 o(B,A,)=max|o(B,Ai,o(B,h),…(B,A,))| 
则 称 B 与 4; 最 贴近 ， 因 此 B 属 于 4; 类 。 

下 面 以 两 个 例子 来 分 别 解释 个 体 模式 识别 与 群体 模式 识别 的 过 程 。 

【 例 5-16】 设 论 域 为 X=|(4,B,C)14+B+C=180°,4 宇 B 宇 C>0}。 其 中 4、B、C 为 三 
角形 的 三 个 内 角 。 设 E，R, 7 分别 表 示 等 腰 、 直 和 角 、 等 边 三 角形 。 任 一 三 角形 x 对 这 三 种 三 
角形 的 从 属 度 为 

















6 
Ka(%)= | el | 





1 a 

pul)= 1-505 1A-90°| | 
1 2 

Mi(%)= [i | 


设 给 定 的 一 个 三 角形 的 内 角 4=80°，B=70°，C=30°， 试 判断 它 属于 哪 一 类 ? 
解 : 计算 给 定 三 角形 对 各 种 三 角形 的 从 属 度 。 


1 2 
Kp(%)= | 10°,40°} | =0.735 


本 
90° 





2 
Wr( x)= [ 80-90° || =0. 790 


1 2 
ui-| 十"| =0.522 


180° 
因此 该 三 角形 属于 直角 三 角形 。 
【 例 5-17】 设 有 五 种 小 麦 ， 分 别 为 早熟 、 矮 杆 、 大 粒 、 高 肥 丰 产 和 中 肥 丰 产 。 它 们 百 





粒 重 指 标 服从 正 态 分 布 ja(x)=e-(7)*。 其 参数 统计 值 如 表 5-10 所 示 。 
表 5-10 五 种 小 麦 参数 统计 值 








现 有 不知 品种 的 小 麦 亲 本 B， 用 统计 方法 测 得 其 百 粒 重 参数 为 a=3.43、b=0.28。 试 
确定 它 属于 上 述 哪 一 品种 。( 两 个 正 态 函 数 的 贴近 度 为 ; 0(4,8)= 2 Te (a) +1]) 


解 : 由 上 述 贴 近 度 公式 可 计算 出 : 
o(B,Ai)=0.91,0(B,A,)=0.72,0(B,As)= 0.50,0(B,As)= 0.76,0(B,As)= 0. 89, 
由 择 近 原则 可 得 B 应 属于 早熟 型 。 


5.6 模糊 聚 类 应 用 案例 分 析 


一 个 国家 犯罪 率 的 高 低 反 映 了 一 个 国家 的 社会 和 谐 程 度 。 犯 罪 率 的 研究 对 社会 的 稳定 、 
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国家 的 发 展 有 着 重要 的 作用 。 一 个 国家 的 犯罪 率 与 多 种 因素 有 关 ， 这 些 因素 与 犯罪 率 之 间 的 
关系 又 十 分 复杂 ， 如 何 分 析 清 楚 各 因素 的 内 在 关系 以 及 对 犯罪 率 的 影响 ,一 直 是 法 律 工作 者 
研究 的 难题 。 一 些 法 律 工 作者 试图 根据 已 有 的 一 些 数据 直接 揭示 犯罪 率 与 这 些 因素 之 间 的 关 
系 ， 并 通过 建立 线性 或 者 简单 的 函数 模型 来 确定 这 些 因 素 对 犯罪 率 的 影响 。 但 由 于 现实 问题 
的 复杂 性 ， 很 难 获得 有 效 的 模型 。 法 学 工作 者 根据 长 期 的 理论 分 析 ， 总 结 出 对 一 个 国家 的 犯 
罪 率 具有 较 大 影响 的 五 种 主要 因素 ,分 别 是 国家 的 历史 文化 的 悠久 程度 、 国 民 的 富裕 程度 、 
人 口 密 集 程度 、 失 业 率 以 及 国民 素质 等 。 通 常 认为 ， 国 家 的 悠久 历史 和 文化 、 国 民 的 富裕 程 
度 和 素质 的 提高 、 失 业 率 的 降低 等 都 助 于 犯罪 率 的 降低 ,但 此 结论 的 正确 性 却 无 法 得 到 严 庶 
的 证 明 或 证 实 ， 因 此 不 具有 很 强 的 说 服 力 。 

利用 模糊 聚 类 分 析 方 法 ， 建 立 起 各 因素 对 犯罪 率 的 影响 关系 ， 从 而 可 得 到 对 法 律 工作 者 
具有 借鉴 意义 的 参考 结论 。 

选择 六 个 典型 国家 的 数据 作为 已 知 训练 样本 ， 即 高 犯罪 率 的 美国 、 瑞 典 ， 中 犯罪 率 的 法 
国 和 联邦 德国 ， 低 犯罪 率 的 埃及 、 菲 律 宾 ， 具体 数据 如 表 5-11 所 示 。 






































































































































表 5-11 典型 犯罪 率 国家 的 已 知 样本 数据 
建国 时 间 ,人均 国民 生产 总 值 失业 率 人 均 教 育 支 出 人 口 密度 
粹 曙 | 作 民 区 
类 别 | 国名 | 犯罪 率 /年 /美元 /%o /美元 /CA/ km?) 
美国 ”| 45. 8380 213 11360 9.6 676 24 
瑞典 | 50. 8800 180 13520 1.9 1164 18 
法 国 ”| 13. 5868 1406 11730 直拨 560 98 
中 犯罪 率 
联邦 德国 | 15. 9764 40 13590 5.5 566 247 
埃及 0. 1931 67 580 4.6 19 41 
低 犯 罪 率 
菲律宾 | 0. 4201 43 720 5.4 12 159 
选择 表 5-12 的 六 个 国家 数据 作为 测试 样本 。 
表 5-12 测试 样本 数据 
2 es 建国 时 间 | 人 均 国 民生 产 总 值 失业 率 人 均 教 育 支出 人 口 密度 
国名 犯罪 率 S 到 
/年 /美元 /%o /美元 /( 人 /km’) 
印度 2. 1669 42 240 8.5 6 198 
英国 7.6210 923 7920 11.3 360 229 
日 本 5. 1901 1406 9890 7 508 311 
韩国 11. 3564 41 1520 4.6 52 382 
马里 1. 0004 29 190 0.1 8 5 
斯 里 兰 卡 3.3616 41 270 12.8 5 225 
表 5-11 和 表 5-12 中 的 六 个 统计 指标 分 别 来 源 于 国际 刑警 组 织 的 《国际 犯罪 统计 资料 》、 
美国 国会 图 书馆 、《 世 界 银行 图 表 集 》、 联 合 国 国 际 劳 工 局 、 联 合 国教 科 文 组 织 以 及 《联合 





国人 口 统计 年 鉴 》， 数 据 所 属 时间 为 1983 年 。 


利用 上 述 五 种 指标 作为 聚 类 特 生 











E， 在 有 监督 的 情况 下 ， 通 过 不 断 修改 各 因素 权重 的 方法 


寻找 最 优 值 ， 将 模糊 动态 内 类 结果 作为 寻 优 指 标 。 当 上 聚 类 结果 与 期 望 结果 一 致 时 ， 即 可 确定 
各 因素 对 犯罪 率 影响 的 权重 。 
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设 五 个 指标 对 犯罪 率 影 响 的 权重 系数 向 量 0=[ gi ,q2,93,94,4s ] 为 优化 变量 ,按照 犯 罪 
率 高 低 对 给 定 的 六 个 国家 进行 聚 类 分 析 。 
模糊 聚 类 分 析 中 的 相似 矩阵 可 采用 绝对 值 减 数 法 或 夹 角 余 弦 法 求 取 。 
如 果 采 用 绝对 值 减 数 法 求 相似 矩阵 ， 其 计算 公式 为 
下 i=j 


Tr.. 三 5 
" 1 -cD qx -x | i 天 7 
k=1 


式 中 ，e 的 选取 应 使 0<r;<1。 
如 果 采 用 夹 角 余弦 法 求 相似 矩阵 ， 其 计算 公式 为 


5 
2 
| > GENEX jk | 
k=1 


La 5 5 
| 上 
式 中 ,rj 表示 第 i 个 国家 与 第 j 个 国家 的 相似 性 系数 ; xi 表示 第 i 个 国家 的 第 个 指标 数据 。 


优化 指标 ] 衡量 当前 聚 类 结果 与 期 望 聚 类 结果 的 差异 程度 。 期 望 的 聚 类 结果 传递 闭 包 拢 

阵 应 具有 下 列 形 式 
min|r; | 样本 i 与 样本 j 为 同类 | >max|ri | 样本 i 与 样本 上 非 同类 | 

指标 /为 传递 闭 包 和 矩阵 中 符合 上 式 的 元 素数 量 。 

具体 优化 过 程 可 采用 第 8 章 中 的 混沌 优化 方法 进行 计算 。 

利用 绝对 值 减 数 法 求 取 相 似 和 矩阵， 经 过 多 次 长 时 间 计 算 都 无 法 得 到 满意 的 聚 类 结果 ， 说 
明 绝 对 值 减 数 法 不 适合 描述 该 数据 之 间 的 相似 性 。 利 用 夹 角 余弦 法 可 得 到 正确 的 聚 类 结果 ， 
所 得 权 值 矩阵 为 

Q=[0. 0003, 0. 001221, 0. 427000, 0.006460, 0. 100000] 

所 得 相似 矩阵 为 
| 1. 000000 0.965309 0.633804 0.862912 0.155266 0.257044 
0.965309 1.000000 0.684798 0.911517 0.244340 0.401231 
0. 633804 0.684798 1.000000 0.923181 0.853565 0.853125 
0. 862912 0.911517 0.923181 1.000000 0.607467 0.689493 
0.155266 0.244340 0.853565 0.607467 1.000000 0.949920 
[0.257044 0.401231 0.853125 0.689493 0.949920 1.000000 
传递 闭 包 和 矩阵 为 
[1.000000 0.965309 0.911517 0.911517 0.853565 0.853565 
0. 965309 1.000000 0.911517 0.911517 0.853565 0.853565 
0.911517 0.911517 1.000000 0.923181 0.853565 0.853565 
0.911517 0.911517 0.923181 1.000000 0.853565 0.853565 
0. 853565 0.853565 0.853565 0.853565 1.000000 0.949920 
[0.853565 0.8535655 0.853565 0.853565 0.949920 1.000000 
聚 类 阔 值 A 由 1 降 至 0， 即 可 实现 动态 聚 类 ， 所 得 动态 聚 类 图 如 图 5-12 所 示 。 
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从 上 图 可 见 ， 当 和 =0.923181 时 ， 六 个 国 


1 


家 分 别 聚 成 三 类 ， 美 国 和 瑞典 为 高 犯罪 率 国 

家 聚 为 一 类 ， 法 国 和 联邦 德国 为 较 低 犯 罪 率 ”696s309 
国家 聚 为 一 类 ， 埃 及 和 菲律宾 为 低 犯 罪 率 国 0949920 
家 聚 为 一 类 。 从 而 实现 了 已 知 样本 的 正确 313 





聚 类 。 


1.000000 


0.911517 
0.853565 


为 验证 上 述 结果 的 有 效 性 ， 根 据 表 5-12 0.000000 
的 测试 数据 ， 将 印度 的 特征 数据 也 加 入 到 上 
述 六 国 ， 进 行动 态 聚 类 分 析 ， 所 得 传递 闭 包 





和 矩阵 如 下 : 

. 000000 0.965309 
.965309 1.000000 
.911517 0.911517 
.911517 0.911517 
. 853565 0.853565 
. 853565 0.853565 
. 853565 0.853565 


Ce 
关 
ll 
SS SS SS © Se 





由 于 印度 的 犯罪 率 和 训练 样本 的 六 个 国家 相 比 属于 低 犯罪 率 。 


0.911317 
0.911517 
1. 000000 
0.923181 
0. 853565 
0. 853565 
0. 853565 


0.911517 
0.911517 
0.923181 
1. 000000 
0. 853565 
0. 853565 
0. 853565 














美国 ”瑞典 
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法 国 联邦 德国 埃及 菲律宾 

















图 5-12 ”训练 样本 动态 聚 类 结果 


0. 853565 
0. 853565 
0. 853565 
0. 853565 
1. 000000 
0. 998498 
0.955313 


0. 853565 
0. 853565 
0. 853565 
0. 853565 
0. 998498 
1. 000000 
0.955313 


当 阔 值 和 = 


0. 853565 
0. 853565 
0. 853565 
0. 853565 
0. 955313 
0. 955313 
1. 000000 
0. 923181 时 ， 


按照 上 述 所 得 传递 闭 包 矩阵 可 实现 正确 聚 类 ， 即 : 1 美国 ， 瑞 典 | ，| 法国 ， 联 邦 德国 | ，| 印 


度 ， 埃 及 ， 非 律 宾 | 。 





将 全 部 的 12 个 国家 样本 共同 实现 聚 类 过 程 的 结果 如 图 5-13 所 示 。 








国家 瑞典 美国 ”法 国联 邦 德国 英国 日 本 马里 韩国 斯 里 兰 卡 印度 菲 得 
犯罪 率 50.88 45.84 13.59 15.98 7.62 5.19 1.00 11.36 3.36 2.17 0.42 


EL 


1.000000 
0.998498 
0.998376 
0.996762 
0.995696 
0.992917 
0.987372 
0.968469 
0.965309 
0.944680 
0.923181 
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图 5-13 





12 国 数据 的 动态 聚 类 结果 





lL 宾 埃及 
0.19 


由 上 述 动态 聚 类 过 程 可 见 ，12 个 国家 动态 聚 类 过 程 基本 符合 要 求 ， 能 够 达到 较 满 意 的 


效果 ， 如 犯罪 率 较 低 的 国家 印度 、 草 律 宾 


ws 沪 














斯 里 兰 卡 等 能 


于 上 用 


够 较 容 易 聚 类 在 一 起 ， 英 国 、 日 


本 、 联 邦 德国 等 犯罪 率 较 接 近 的 国家 聚 类 在 一 起 ， 瑞 典 和 美国 两 个 犯罪 率 高 的 国家 聚 类 在 一 
起 。 当 和 =0.923181 时 ，12 个 国家 聚 成 两 类 ， 一 类 是 瑞典 和 美国 两 个 犯罪 率 高 的 国家 ， 另 


一 类 是 其 他 犯罪 率 相 对 低 的 国家 。 这 个 聚 类 结 


的 权重 矩阵 ， 可 实现 犯罪 率 问题 的 较为 正确 的 分 类 。 


符合 实际 情况 。 由 此 可 见 ， 上 述 方法 所 确定 


(40) 





3 人 工 智 能 技术 


上 述 聚 类 过 程 中 ， 马 里 和 韩国 两 个 国家 在 最 初 的 聚 类 过 程 中 出 现 了 一 些 偏差 。 这 主要 是 
由 于 上 述 数据 是 真实 的 统计 数据 ， 由 于 统计 过 程 中 的 误差 以 及 各 类 指标 在 各 国 的 定义 标准 不 
同 、 统 计 方 法 不 同等 (例如 ， 某 些 相 同行 为 在 某 些 国家 是 犯罪 行为 ,但 在 其 他 国家 可 能 3 
不 认定 为 是 犯罪 行为 ) ， 因 此 这 些 数据 本 身 的 标准 并 不 一 致 ， 也 就 是 数据 本 身 并 不 是 完全 理 
想 的 数据 ， 因 此 不 可 能 保证 实现 上 述 12 个 国家 完全 理想 的 聚 类 过 程 。 总 体 来 看 ， 上 述 聚 类 
过 程 结果 基本 令 人 满意 。 

由 权重 矩阵 O = [ 0. 0003，0. 001221,，0. 427000,，0. 006460,，0. 100000] 可 见 ， 在 上述 五 
个 因素 中 ， 失 业 率 对 犯罪 率 的 影响 最 大 ， 人 口 密 集 程度 影响 其 次 ， 并 且 这 两 个 因素 的 影响 程 
度 在 同一 数量 级 上 ; 国民 素质 (人均 教 育 文 出 ) 再 次 ， 国 民 富 裕 程 度 (人 均 国 民生 产 总 值 ) 
影响 更 小 ， 并 且 这 两 个 因素 的 影响 在 同一 数量 级 上 。 而 国家 的 历史 (建国 时 间 ) 对 犯罪 率 
的 影响 最 小 ， 并 且 影 响 程度 的 数量 级 也 较 其 他 因素 小 很 多 。 

结合 实际 数据 和 聚 类 结果 ， 我 们 可 以 作出 如 下 分 析 : 

失业 率 越 高 则 犯罪 率 越 高 ， 人 口 密度 越 小 则 犯罪 率 越 高 。 这 两 个 因素 对 一 个 国家 的 犯罪 
率 起 到 决定 性 作用 。 例 如 ， 美国 失业 率 较 高 ， 人 口 密度 也 较 小 ， 因 此 是 典型 的 高 犯罪 率 
国家 。 

对 于 这 一 结果 可 作 如 下 解释 : 高 失业 率 造 成 社会 不 稳定 人 群 数量 增加 ， 显 然 容 易 提高 犯 
罪 率 ， 这 一 点 大 多 数 法 律 工 作者 是 认可 的 。 而 人 口 密度 对 犯罪 率 的 影响 是 与 计算 方法 有 关 
的 。 由 于 犯罪 率 的 计算 是 犯罪 的 人 数 除 以 总 人 数 ， 因 此 当 人 口 密度 较 小 ， 即 使 犯罪 人 口 的 绝 
对 数量 并 不 很 多 , 但 由 于 人 口 基数 少 ， 从 而 造成 犯罪 的 相对 值 (犯罪 率 ) 较 高 。 因 此 造成 
虽然 失业 率 不 高 的 瑞典 ， 由 于 人 口 密度 很 小 ， 也 成 为 犯罪 率 高 的 国家 。 

据 此 可 见 ， 英 国 虽 然 失 业 率 高 ， 但 人 口 密度 较 大 ， 因 此 英国 的 犯罪 率 并 不 很 高 。 法 国 、 
联邦 德国 、 韩 国 失业 率 较 高 ， 但 人 口 密度 也 较 大 ， 因 此 犯罪 率 处 于 较 高 的 状态 。 日 本 与 上 述 
三 国 相 比 ， 失 业 率 不 高 ， 人 口 密度 较 大 ， 因 此 犯罪 率 较 这 三 国 低 。 马 里 的 失业 率 最 低 ， 但 人 
口 密度 也 最 小 ， 因 此 犯罪 率 也 处 于 较 低 状态 。 

人 均 教育 文 出 与 人 均 国 民生 产 总 值 这 两 个 因素 有 一 定 的 相关 性 ,通常 国家 越 富 裕 ， 则 国 
民生 产 总 值 越 高 ， 人 均 教育 文 出 也 会 越 高 。 因 此 这 两 个 因素 可 区 分 国家 的 经 济 情况 ， 并 且 这 
两 个 因素 对 犯罪 率 的 影响 也 在 相同 的 数量 级 上 。 一 般 的 法 律 工作 者 认为 ， 国 民 素 质 越 高 应 该 
犯罪 率 越 低 。 但 上 述 的 聚 类 结果 却 得 到 了 相反 的 结论 。 对 这 一 结论 可 解释 如 下 : 由 于 数据 的 
统计 方式 各 国家 不 同 ， 另 外 各 国 犯 罪 的 定义 与 形式 也 各 不 相同 ， 通 常情 况 下 ， 国 家 越 是 发 
达 ， 教 育 投入 越 多 ， 则 国民 素质 越 高 ， 国 家 对 国民 的 要 求 也 越 高 (如 某 些 发 达 国 家 和 地 区 ， 
对 于 类 似 乘 公 交 车 不 买 票 、 向 未 成 年 人 售 酒 、 父 母体 罚 孩 子 、 打 胎 喃 胎 等 行为 都 属于 犯罪 行 
为 ， 而 在 某 些 发 展 中 国家 ， 上 述 这 些 行为 则 有 可 能 不 被 认定 为 是 犯罪 行为 ) ， 因 此 某 些 发 达 
国家 的 犯罪 阔 值 较 低 ， 犯 罪 的 形式 和 种 类 较 多 ， 也 就 是 说 犯罪 的 认定 标准 在 不 同 发 达 程 度 和 
不 同 认 知 的 国家 差异 较 大 ， 因 此 造成 相同 情况 下 ， 发 达 国 家 的 犯罪 率 较 高 。 只 有 在 发 达 程 度 
相当 的 情况 下 ， 才 可 利用 失业 率 和 人 口 密度 等 因素 来 确定 犯罪 率 的 高 低 。 

例如 ， 斯 里 兰 卡 和 印度 与 日 本 相 比 ， 失 业 率 高 、 人 口 密度 小 ， 如 果 只 按 上 述 两 个 因素 判 
断 ， 则 应 属于 较 高 犯罪 率 的 国家 ， 实 际 上 日 本 属于 发 达 国 家 ， 而 印度 和 斯 里 兰 卡 属于 发 展 中 
国家 ， 因 此 相 比 日 本 ， 印 度 和 斯 里 兰 卡 的 犯罪 率 并 不 很 高 。 同 样 的 分 析 也 适用 于 埃及 和 菲 


律 宾 。 


(42) 




























































































第 5 章 模糊 理论 及 应 用 人 6 


由 此 可 见 ， 在 相同 情况 下 ， 发 达 国 家 的 犯罪 率 高 于 发 展 中 国家 的 犯罪 率 ， 这 可 能 是 由 于 
发 达 国 家 本 身 对 于 犯罪 的 形式 和 程度 的 认定 比 发 展 中 国家 细 化 ， 发 达 国 家 对 人 们 的 要 求 高 一 
些 。 一 些 在 发 展 中 国家 不 属于 犯罪 的 行为 ， 在 发 达 国 家 则 可 能 被 认定 为 是 犯罪 行为 ， 因 此 造 
成 犯罪 率 统计 结果 较 高 。 

最 后 ， 国 家 的 历史 文化 悠久 程度 对 于 犯罪 率 的 影响 很 小 。 也 就 是 人 们 的 思维 方式 以 及 形 
成 的 风俗 习惯 对 犯罪 率 的 影响 很 小 ， 犯 罪 率 的 高 低 主要 取决 于 当前 的 国家 状况 。 

上 述 结论 是 从 客观 数据 聚 类 结果 分 析 所 得 ， 与 传统 的 法 学 工作 者 的 研究 方法 和 人 研究 手段 
不 同 ， 因 此 ， 所 得 结论 也 仅 供 法 学 工作 者 参考 使 用 。 





习题 


5.1 模糊 性 与 随机 性 的 区 别 是 什么 ? 
5.2 模糊 集合 与 精确 集合 的 区 别 是 什么 ? 
5.3 ”模糊 推理 的 一 般 过 程 是 什么 ? 
5.4 ” 设 论 域 U=|xi ,x;y,x3, x4， Xs|，A 和 B 是 定义 在 论 域 U 上 的 两 个 模糊 集合 ， 其 
_0.8,0.6,0.9,0.75 0.9 

X1 MX2 X33 MX4 Xs 
03504030.8,0.2 


NX] MX NX3 Xa4 Xs 


3 
扯 


4 








试 求 : 4nB、4UB、4 和 B。 
5.5 设 有 三 个 病人 组 成 的 集合 X= xi ,x, ,x3| ， 病 人 的 症状 集合 为 了 = |y1 ,ys,Y3,Y4,Ys| ， 三 类 病情 集 
合 为 Z=1z 2 ,2 于 与 了 之 间 的 模糊 关系 0 以 及 了 与 2 之 间 的 模糊 关系 民 分 别 为 
「0.4 0.8 0.9 
0.2 0.6 0.3 0.7 加 0.8 0.2 0.1 
,R= 





Q=|0.7 0.1 0.2 0.2 0.9 0.5 0.9 0.8 
0.9 0.3 0.8 0.3 0.4 0.9 0.4 0.3 


[0.3 0.9 0.6 








试 求 病人 集合 与 病情 集合 Z 之 间 的 模糊 关系 5。 
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机 器 学 习 和 神经 网 络 


6.1 机 器 学 习 的 基本 概念 和 发 展 史 


人 类 具有 学 习 的 本 能 ， 这 也 是 人 类 的 智能 特征 之 一 。 长 久 以 来 ， 人 们 一 直 探索 如 何 使 机 
器 也 能 够 具有 像 人 类 一 样 的 自我 学 习 能 

人 们 对 机 器 学 习 的 探索 研究 从 20 世纪 50 年 代 开 始 ， 经 历 了 大 致 三 个 阶段 。 第 一 个 阶段 
是 从 20 世纪 50 年 代 中 期 开始 的 探索 期 。 受 神经 生理 学 和 生物 学 的 影响 ， 机 顺 学 习 的 研究 主 
要 侧重 于 神经 元 网 络 模型 的 研究 。 第 二 个 阶段 是 从 20 世纪 70 年 代 开 始 的 发 展 时 期 。 在 这 一 
时 期 ， 由 于 专家 系统 的 研究 取得 了 较 大 的 成 功 ， 知 识 获取 成 为 当时 迫切 要 求解 决 的 难题 ， 因 
此 机 器 学 习 的 研究 者 提出 了 基于 高 层 知识 符号 表示 的 机 器 学 习 横 型 。 由 于 符号 学 习 人 研究 的 迅 
速 发 展 ， 实 例 学 习 、 观 察 和 发 现 学 习 、 类 比 学 习 以 及 解释 学 习 等 多 种 学 习 策 略 不 断 涌现 出 
来 。 从 20 世纪 80 年 代 开 始 ， 机 顺 学 习 的 研究 进入 了 快速 发 展 时 期 。 在 这 一 时 期 ， 神 经 网 络 
的 研究 重新 兴起 ， 符 号 学 习 由 “无 知 ” 学 习 转 向 增长 型 学 习 。 进 化 学 习 、 知 识 发 现 和 数据 
挖掘 等 研究 得 到 了 迅速 发 展 。 

虽然 机 噩 学 习 理 论 不 断 完 善 和 发 展 ， 但 目前 为 止 ， 我 们 仍 不 知道 如 何 使 机 器 拥有 像 人 类 
一 样 的 学 习 能 力 。 不 过 ， 一 些 针对 求解 特定 任务 的 学 习 算法 已 经 出 现 ， 并 在 许多 领域 中 取得 
成 功 的 应 用 。 

另外 ， 对 于 学 习 的 概念 目前 仍 无 统一 的 定义 ， 不 同时 期 不 同 领域 的 学 者 曾 给 出 过 不 同 的 
概念 。 通 常 的 观点 是 将 学 习 描述 为 机 器 利用 获取 知识 、 发 现 规律 、 积 累 经 验 等 方法 和 手段 来 
改进 或 完善 系统 性 能 的 过 程 。 通 常设 计 一 个 学 习 系 统 要 明确 三 个 问题 : 

1) 任务 : 即 要 解决 什么 样 的 问题 。 

2) 标准 : 即 衡量 或 评价 系统 性 能 好 坏 的 指标 或 标准 。 

3) 知识 源 ， 即 学 习 经 验 或 知识 的 来 源 。 

例如 : 对 于 一 个 机 融 人 下 棋 的 学 习 系 统 ， 所 要 明确 的 三 个 问题 可 列 出 如 下 : 

1) 任务 : 正确 下 棋 。 

2) 标准 : 比赛 中 击败 对 手 的 概率 或 可 能 性 。 

3) 知识 源 : 对 奔 比 赛 训练 。 

而 对 于 手写 文字 识别 的 学 习 系 统 ， 所 要 明确 的 三 个 问题 可 为 : 

1) 任务 : 对 手写 文字 进行 分 类 和 识别 。 

2) 标准 : 分 类 或 识别 的 正确 率 。 
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3) 知识 源 : 已 知 样本 的 数据 库 。 

再 如 ， 对 于 机 器 人 自动 驾驶 的 学 习 系统 ， 所 要 明确 的 三 个 问题 为 ; 

1) 任务 : 在 高 速 公 路 上 自动 驾驶 汽车 。 

2) 标准 ， 无 错 行驶 平均 里 程 。 

3) 知识 源 ， 专家 驾驶 经 验 和 驾驶 指令 。 

一 个 机 器 学 习 的 系统 模型 一 般 可 以 简单 地 表示 成 图 6-1 所 示 的 形式 。 

其 中 ， 环 境 为 系统 学 习 提 
供 外 部 信息 ， 系 统 的 学 习 机 构 
通过 对 环境 的 搜索 取得 外 部 信 一 
息 ， 经 过 分 析 、 综 合 、 类 比 、 BY 
归纳 等 思维 过 程 获得 知识 ， 并 将 知识 存 人 知识 库 中 。 执 行 环节 应 用 所 学 到 的 知识 求解 现实 问 
题 。 评 价 环节 验证 和 评价 执行 的 效果 ， 并 将 执行 效果 反馈 给 学 习 部 分 ， 来 完善 和 修改 知识 库 
中 的 知识 ， 指 导 进 一 步 的 学 习 工 作 。 














执行 与 评价 








6.2 经 由 机 融 学 习 方 法 


1. 机 械 学 习 

机 械 学 习 也 称 为 死记 式 学 习 ， 是 一 种 最 简单 、 最 原始 、 最 基本 的 学 习 方 法 。 这 种 学 习 类 
似 于 小 孩子 最 初 对 文字 、 单 词 等 的 学 习 过 程 。 只 是 通过 记忆 把 新 的 知识 简单 地 存储 起 来 ， 供 
需要 时 检索 调用 ， 不 需要 进行 计算 和 推理 。 求 解 问题 时 就 从 知识 库 中 检索 出 相应 的 知识 直接 
用 来 求解 问题 。 

机 械 学 习 由 于 其 学 习 方式 简单 ， 因 此 应 用 范围 有 限 ,需要 在 某 些 特定 情况 下 使 用 才 有 意 
义 。 例 如 ， 如 果 利用 机 械 学 习 检 索 一 个 项 目的 时 间 比 重新 计算 一 个 项 目的 时 间 要 短 ， 这 时 机 
械 学 习 才 有 意义 。 检 索 得 越 快 ， 其 意义 也 越 大 。 相 反 ， 如 果 检 索 一 个 数据 所 需 时 间 比 重新 计 
算 一 个 数据 所 需 时 间 还 要 多 ， 机 械 学 习 也 就 失去 了 意义 。 男 外 ， 机 械 学 习 所 存储 的 信息 应 该 
能 够 适用 于 后 来 情况 。 如 果 信 息 变化 特别 频繁 ， 所 存储 的 信息 很 快 就 不 适用 了 ， 那 么 机 械 学 
习 同 样 也 失去 了 意义 。 

2. 指导 式 学 习 

此 导 式 学 习 是 比 机 械 式 学 习 更 复杂 一 点 的 学 习 方 式 ， 又 称 嘱 附 式 学 习 或 教授 式 学 习 。 在 
这 种 学 习 方 式 下 ， 外 部 环境 向 系统 提供 一 般 性 的 指示 或 建议 ， 系 统 把 它们 具体 地 转换 为 细节 
知识 并 送 入 知识 库 。 在 学 习 过 程 中 要 反复 对 形成 的 知识 进行 评价 ， 使 其 不 断 完 善 。 

对 于 使 用 指导 式 学 习 策略 的 系统 来 说 ， 外 界 输入 知识 的 表达 方式 与 内 部 表达 方式 不 完全 
一 致 ， 系 统 在 接收 外 部 知识 时 需要 一 点 推理 、 翻 译 和 转换 工作 。 一 般 地 ， 指 导 式 学 习 系统 需 
要 通过 请 求 、 解 释 、 实 用 化 、 并 入 、 评 价 等 步 又 实现 其 功能 。 其 中 ， 请 求 就 是 征询 指导 者 的 
指示 或 建议 ; 解释 就 是 消化 吸收 指导 者 的 建议 并 把 它 转换 成 内 部 表示 ; 实用 化 是 把 指导 者 的 
指示 或 建议 转换 成 能 够 使 用 的 形式 ; 并 入 就 是 并 入 到 知识 库 中 ; 评价 就 是 评价 执行 部 分 动作 
的 结果 ， 并 将 结果 反馈 到 第 一 步 。 

指导 式 学 习 是 一 种 比较 实用 的 学 习 方 法 ， 可 用 于 专家 知识 获取 。 它 既 可 避免 由 系统 自己 
进行 分 析 、 上 归纳 从 而 产生 新 知识 所 带 来 的 困难 ， 又 无 需 领 域 专家 了 解 系统 内 部 知识 表示 和 组 
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织 的 细节 ， 因 此 目前 应 用 得 较 多 。 

3. 类 比 学 习 

类 比 是 人 们 认识 世界 的 一 种 重要 方法 ,也 是 诱导 人 们 学 习 新 事物 、 进 行 创造 性 思维 的 重 
要 和 手段。 类比 能 够 清晰 、 简 洁 地 描述 对 象 之 间 的 相似 性 。 类 比 学 习 就 是 通过 类 比 ， 即 通过 相 
似 事 物 加 以 比较 所 进行 的 一 种 学 习 。 

类 比 学 习 的 基础 是 类 比 推理 。 类 比 推理 是 由 新 情况 与 已 知情 况 在 某 些 方面 的 相似 来 推出 
它们 在 其 他 相关 方面 的 相似 。 类 比 推理 是 在 两 个 相似 域 之 间 进 行 的 ， 一 个 是 已 经 认识 的 源 
域 , 或 者 称 为 基 (类 比 源 ) ， 包 括 过 去 曾经 解决 过 且 与 当前 问题 类 似 的 问题 以 及 相关 知识 ; 
另 一 个 是 当前 尚未 完全 认识 的 目标 域 ， 是 竺 解决 的 新 间 题 。 类 比 推理 的 目的 是 从 源 域 中 选 出 
与 当前 问题 最 近似 的 问题 及 其 求解 方法 以 求解 当前 问题 ， 或 者 建立 起 目标 域 中 已 有 命题 间 的 
联系 ， 形 成 新 知识 。 

类 比 学 习 主 要 包括 以 下 四 个 过 程 : 

1) 输入 一 组 已 知 条件 (已 解决 问题 ) 和 一 组 未 完全 确定 的 条 件 〈 新 问题 ) 。 

2) 对 输入 的 两 组 条 件 ， 根 据 其 描述 ， 按 某 种 相似 性 的 定义 寻找 两 者 可 类 比 的 对 应 
关系 。 

3) 根据 相似 变化 的 方法 ， 将 已 有 问题 的 概念 、 特 性 、 方 法 、 关 系 等 映射 到 新 问题 上 ， 
以 获得 竺 求解 新 间 题 所 需 的 新 知识 。 

4) 对 类 推 得 到 的 新 间 题 的 新 知识 进行 校 验 。 验 证 正确 的 知识 存 和 人 知识 库 中 ， 而 暂时 还 
无 法 验证 的 知识 只 能 作为 参考 性 知识 ， 置 于 数据 库 中 。 

当前 类 比 学 习 模拟 的 主要 困难 是 基 (类 比 源 ) 的 联想 ， 即 给 定 一 个 目标 域 , 再 从 无 数 
个 错综复杂 的 结构 中 找 出 一 个 或 数 个 候选 的 基 。 在 当前 实际 应 用 中 ， 基 都 是 由 用 户 给 出 的 ， 
这 实际 上 决定 了 机 器 只 能 重复 人 们 已 知 的 类 比 ， 而 不 能 帮助 人 们 学 到 什么 。 

4. 归纳 学 习 

归纳 是 人 类 拓展 认识 能 力 的 重要 方法 ， 是 一 种 从 个 体 到 一 般 、 从 部 分 到 整体 的 推理 行 
为 。 归 纳 推理 是 使 用 归纳 方法 所 进行 的 推理 ， 即 从 足够 多 的 事例 中 归纳 出 一 般 性 的 知识 ， 它 
是 一 种 从 个 体 到 一 般 的 推理 。 归 纳 学 习 是 应 用 归纳 推理 进行 学 习 的 一 类 学 习 方法 ， 也 是 研究 
最 广 的 一 种 符号 学 习 方 法 。 

由 于 在 进行 归纳 时 ， 通 常 不 能 考察 全 部 有 关 的 事例 ， 因 而 归纳 出 的 结论 不 能 绝对 保证 它 
的 正确 性 ， 只 能 以 某 种 程度 相信 它 为 真 ， 这 是 归纳 推理 的 一 个 重要 特征 。 例 如 ， 由 “ 喜 竟 
会 飞 ”“ 麻 丛 会 飞 ”“ 乌 鸦 会 飞 ” 这 样 一 些 已 知事 实 ， 有 可 能 归纳 出 “有 羽毛 的 动物 会 飞 ” 
“ 鸟 会 飞 ” 等 结论 。 这 些 结论 一 般 情况 下 是 正确 的 。 但 能 鸟 、 企 鹅 等 鸟 类 有 羽毛 ,但 是 却 不 
会 飞 ， 这 就 说 明 上 面 归纳 的 结论 不 是 绝对 为 真 的 ， 只 能 以 某 种 程度 相信 它 为 真 。 

在 进行 归纳 学 习 时 ,学 习 者 从 所 提供 的 事实 或 观察 的 假设 进行 归纳 推理 ， 获 得 某 个 概 
念 。 归 纳 学 习 可 按 其 有 无 教师 指导 分 为 示例 学 习 以 及 观察 与 发 现 学 习 。 

(1) 示例 学 习 ”又 称 概 念 获取 或 实例 学 习 。 是 通过 从 环境 中 获取 若干 与 某 概 念 有 关 的 
例子 ， 经 归纳 得 出 一 般 性 概念 的 学 习 方法 。 在 这 种 学 习 方法 中 ， 外 部 环境 (教师 ) 提供 一 
组 例子 (包括 正 例 和 反例 ) ， 学 习 系 统 从 例子 所 列 含 的 知识 中 归纳 出 具有 更 大 适用 范 轩 的 一 
般 性 知识 或 概念 ， 以 覆盖 所 有 的 正 例 和 排除 所 有 的 反例 。 

例如 ， 我 们 用 一 组 动物 为 示例 ， 告 诉 学 习 系 统 哪 个 动物 是 “ 牛 ”， 哪 个 动物 不 是 ， 当 示 
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例 足够 多 时 ， 学 习 系 统 就 能 掌握 “ 牛 ” 的 概念 ， 能 够 把 牛 和 其 他 动物 区 分 开 。 

在 示例 学 习 系 统 中 ， 有 两 个 重要 概念 ， 示例 空间 和 规则 空间 。 示 例 空间 是 我 们 向 系统 提 
供 的 训练 例 集合 。 规 则 空间 是 例子 空间 所 潜在 的 某 种 事物 规律 的 集合 。 学 习 系 统 应 该 从 大 量 
的 训练 例 中 自行 总 结 出 这 些 规 律 。 可 以 把 示例 学 习 看 成 是 选择 训练 例 去 指导 规则 空间 的 搜索 
过 程 ， 直 到 搜索 出 能 够 准确 反映 事物 本 质 的 规则 为 止 。 

(2) 观察 与 发 现 学 习 ”分 为 观察 学 习 与 机 器 发 现 两 种 。 前 者 用 于 对 事例 进行 概念 聚 类 ， 
形成 概念 描述 ; 后 者 用 于 发 现 规律 ,产生 定律 或 规则 。 

概念 聚 类 是 观察 学 习 研 究 中 的 一 个 重要 技术 。 基 本 思想 是 把 事例 按 一 定 的 方式 和 准则 进 
行 分 组 ， 如 划分 为 不 同 的 类 、 不 同 的 层次 等 ， 使 不 同 的 组 代表 不 同 的 概念 ， 并 且 对 每 一 个 分 
组 进行 特征 概括 ， 得 到 一 个 概念 的 语义 符号 描述 。 例 如 对 如 下 事例 : 

斑马 、 老 虎 、 狮 子 、 骆 驴 、 大 象 、 猪 、 牛 、 羊 …… 

根据 它们 是 否 家 养 可 分 为 两 类 : 

野生 动物 = { 斑马 ,， 老虎， 狮子， 骆驼 ， 大 象 ，…! 

家 畜 = | 猪 、 牛 、 羊 ，…| 

这 里 ,“ 野 生动 物 ” 和 “家 畜 ” 就 是 由 分 类 得 到 的 新 概念 ， 根 据 相 应 的 动物 特征 还 可 




















“野生 动物 有 毛 、 肺 、 腿 、 有 奶 、 野 生 ” 

“家 畜 有 毛 、 肺 、 腿 、 有 奶 、 家 养 ” 

如 果 把 它们 的 共同 特性 抽取 出 来 ， 就 可 进一步 形成 “ 兽 类 ”“ 哺 乳 动物 ”等 概念 。 

机 器 发 现 是 指 从 观察 的 事例 或 经 验 中 归纳 出 规律 或 规则 ， 这 是 最 困难 、 最 富有 创造 性 的 
一 种 学 习 。 它 可 分 为 经 验 发 现 与 知识 发 现 两 种 。 前 者 是 指 从 经 验 数据 中 发 现 规律 和 定律 ; 后 
者 是 指 从 已 观察 的 事例 中 发 现 新 的 知识 。 

归纳 学 习 方式 在 协助 获取 专家 知识 方面 起 到 很 好 的 作用 。 由 于 专家 多 年 来 积累 的 经 验 通 
常 是 “ 隐 性 知识 ”， 其 至 只 是 一 种 直觉 ， 因 此 难以 表述 和 提取 。 但 专家 经 验 来 源 于 实践 ， 是 
对 大 量 实例 和 现象 的 归纳 。 因 此 ， 用 归纳 学 习 方 法 来 获取 专家 知识 恰到好处 ， 它 为 解决 专家 
系统 的 知识 获取 这 个 瓶颈 问题 提供 了 重要 的 手段 。 

但 是 ， 归 纳 学 习 仅 通过 实例 之 间 的 比较 来 提取 共性 与 不 同 ， 难 以 区 分 重要 的 、 次 要 的 和 
不 相关 的 信息 。 此 外 ， 归 纳 学 习 要 求 必须 有 多 个 实例 ， 对 有 些 领域 来 说 给 出 多 个 实例 并 非 易 
事 ， 且 得 出 的 归纳 结论 的 正确 性 问题 进一步 限制 了 其 使 用 的 范围 。 

5. 解释 学 习 

基于 解释 的 学 习 是 通过 运用 相关 领域 知识 ， 对 当前 的 实例 进行 分 析 ， 从 而 构造 解释 并 产 
生 相 应 知识 的 一 种 学 习 方法 。 

在 进行 解释 学 习 时 ， 要 向 学 习 系 统 提 供 一 个 实例 和 完善 的 领域 知识 。 在 分 析 实 例 时 ， 首 
先 建 立 关 于 该 实例 是 如 何 满足 所 学 概念 定义 的 一 个 解释 。 由 这 个 解释 所 识别 出 的 实例 的 特 
性 ， 被 用 来 作为 一 般 性 概念 定义 的 基础 ;然后 通过 后 继 的 练习 ， 期 待 学 习 系 统 在 练习 中 能 
发 现 并 总 结 出 更 一 般 性 的 概念 和 原理 。 在 这 个 过 程 中 ， 学 习 系 统 必须 设法 找 出 实例 与 练习 间 
的 因果 关系 ， 并 应 用 实例 去 处 理 练习 ， 把 结果 上 升 为 概念 和 原理 ， 并 存储 起 来 供 以 后 使 用 。 

在 基于 解释 的 学 习 系 统 中 ， 系 统 通 过 应 用 领域 知识 逐步 进行 演绎 ， 最 终 构造 出 训练 实例 
满足 目标 概念 的 证 明 〈 即 解释 ) 。 其 中 领域 知识 对 证 明 的 形成 起 着 重要 的 作用 ， 这 就 要 求 领 
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域 知识 是 完善 的 ， 可 以 解释 被 处 理 的 所 有 例子 。 但 是 在 现实 世界 中 ， 大 多 数 领域 不 具备 这 个 
特征 。 因 此 ， 必 须 研究 如 何 使 基于 解释 的 学 习 在 不 完善 的 领域 理论 中 依然 有 效 ; 同时 ， 还 要 
研究 如 何 修改 不 完善 的 领域 理论 ， 使 之 具有 更 强 的 解释 能 


6.3 基于 神经 网 络 的 学 习 





6.3.1 神经 网 络 概述 


人 工 神经 网 络 技术 是 当前 机 器 学 习 研 究 的 热点 之 一 。 人 工 神经 元 的 研究 起 源 于 脑 神经 元 
学 说 。19 世纪 末 ， 在 生物 、 生 理学 领域 ，Waldeger 等 人 创建 了 神经 元 学 说 。 人 们 认识 神经 
系统 是 由 神经 元 组 成 的 。 大 脑 皮 层 包 括 有 100 亿 个 以 上 的 神经 元 ， 它 们 互相 联结 形成 神经 网 
络 ，, 实现 机 体 与 内 外 环境 的 联系 ， 协 调 全 身 的 各 种 机 能 活动 。 

人 工 神 经 网 络 是 由 简单 的 处 理 单元 组 成 的 大 量 并 行 分 布 的 处 理 机 ， 具 有 一 定 的 目 适应 与 
自 组 织 能 力 。 在 学 习 或 训练 过 程 中 改变 突 触 权 重 值 ， 以 适应 周围 环境 的 要 求 。 

神经 网 络 的 研究 始 于 20 世纪 40 年 代 ， 大 致 经 历 了 由 兴起 、 痕 条 和 兴盛 三 个 阶段 。 

1943 年 ， 神 经 解放 学 家 McCulloch 和 数学 家 Pitts 根据 生物 神经 元 的 基本 生理 特征 提出 
了 MP 神经 元 模型 ， 揭 开 了 神经 网 络 研究 的 序幕 。 

1949 年 ， 生 理学 家 D. 0. Hebb 提出 了 Hebb 规则 ， 为 神经 网 络 的 学 习 算 法 葛 定 了 基础 。 

1957 年 ，Rosenblatt 提出 感知 机 模型 。 次 年 ， 又 提出 了 一 种 新 的 解决 模式 识别 问题 的 监 
督学 习 算 法 ， 并 证 明了 感知 机 收敛 定理 。 

1969 年 ，Minsky 和 Papert 所 若 的 《Perceptron》 一 书 指出 单 层 感知 机 的 处 理 能 力 十 分 有 
限 ， 甚 至 连 异 或 分 类 这 样 的 问题 也 不 能 解决 ， 而 多 层 感知 机 无 有 效 的 学 习 算 法 。 由 于 
Minsky 对 感知 机 的 悲观 态度 以 及 其 在 人 工 智 能 领域 的 权威 性 ， 这 些 论点 使 得 大 批 研 究 人 员 
对 于 人 工 神 经 网 络 的 前 景 失去 信心 。 从 此 人 工 神经 网 络 的 研究 进入 了 萧条 期 。 不 过 ， 在 这 段 
期 间 ， 仍 然 有 不 少 学 者 坚持 人 工 神经 网 络 的 研究 ， 并 取得 了 一 定 的 成 果 。 其 中 典型 的 代表 
有 : 1967 年 ， 日 本 学 者 甘 利 俊 一 (Shun Ichi Amari) 提出 了 自 适 应 模式 分 类 的 学 习 理 论 ; 
1972 年 芬兰 学 者 T，Kohonen 提出 了 自 组 织 映 射 理 论 。 同 年 ， 日 本 学 者 K，Fukushima 提出 了 
认 知 机 模型 。1976 年 ， 美 国学 者 S，A. Grossberg 提出 了 自 适应 谐振 理论 (Adaptive 
Resonance Theory ，ART ) 。 

到 20 世纪 80 年 代 ， 人 工 神 经 网 络 的 研究 迎 来 了 又 一 个 转折 期 。1982 年 和 1984 年 ， 美 
国 加 州 理工 学 院 生 物 物理 学 家 丁 Hopfield 教授 提出 了 离散 型 和 连续 型 两 种 Hopfield 网 络 ， 并 
在 TSP 优化 计算 等 应 用 方面 取得 令 人 震惊 的 突破 性 进展 。1984 年 ，G. Hinton 等 人 结合 模拟 
退火 算法 提出 了 Boltzmann 机 (BM) 网 络 模型 。1986 年 ,，D. E. Rumelhart 和 J. 工 . 
Mcclelland 提出 了 多 层 前 馈 网 络 的 误差 反 回 传播 (Back Propagation，BP) 学 习 算 法 ， 解 决 了 
Minsky 对 神经 网 络 学 习 算 法 方面 的 翡 观 担忧 。 这 使 得 神经 网 络 的 研究 再 次 掀起 高 潮 ， 从 此 
神经 网 络 的 研究 步 人 兴盛 期 。 

1988 年 ，Broomhead 和 Lowe 用 径 向 基 哨 数 (Radial Basis Functions，RBF) 提出 了 分 层 
反馈 网 络 设计 方法 。 特 别 是 20 世纪 的 最 后 十 年 ， 神 经 网 络 领域 的 研究 取得 了 新 进展 ， 许 多 
关于 神经 网 络 的 新 理论 和 新 应 用 层出不穷 。 尤 其 90 年 代 初 期 Vapnik 等 人 提出 了 以 有 限 样本 
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学 习 理 论 为 基础 的 支持 向 量 机 (Support Vector Machines，SVM)。 支 持 向 量 机 的 特征 在 于 
Vapnik-Chervonenkis (VC) 维特 征 蕴含 在 向 量 机 的 设计 中 ，VC 维 数 为 衡量 神经 网 络 样本 学 
习 能 力 提供 了 一 种 有 效 的 量度 。 

现在 ， 随 着 人 工 智 能 技术 的 快速 发 展 ， 人 工 神经 网 络 再 一 次 迎 来 了 研究 热潮 。 特 别 是 深 
度 学 习 、 卷 积 神经 网 络 等 概念 的 出 现 ， 为 人 工 神 经 网 络 的 研究 开辟 了 新 方向 ， 注 入 了 新 
活力 。 

随 着 人 工 神经 网 络 理论 的 不 断 完 善 和 发 展 ， 神 经 网 络 的 应 用 研究 不 断 取得 新 的 进展 。 其 
应 用 领域 涉及 计算 机 视觉 、 语 言 识 别 、 优 化 计算 、 智 能 控制 、 系 统 建 模 、 模 式 识 别 、 理 解 与 
认 知 、 神 经 计算 机 、 知 识 推 理 等 诸多 领域 。 其 理论 研究 涉及 神经 生物 学 、 认 知 科 学 、 数 理科 
学 、 心 理学 、 信 息 科学 、 计 算 机 科学 、 动 力学 、 生 物 电 子 学 等 诸多 学 科 。 尤 其 是 美国 和 日 本 
逐渐 实现 人 工 神经 网 络 的 硬件 化 ， 生 产 了 一 些 神 经 网 络 专用 芯片 ， 并 逐步 形成 产品 。 

目前 ， 包 括 我 国 在 内 的 诸多 国家 都 在 对 人 工 神经 网 络 方面 的 研究 投入 大 量 的 资金 支持 。 
相信 不 久 ， 大 量 的 新 模型 、 新 理论 和 新 的 应 用 成 果 将 不 断 涌现 出 来 。 


6. 3.2 人 工 神 经 网 络 模型 


1. 生物 神经 元 模型 

人 类 大 脑 皮层 中 有 大 约 100 亿 个 神经 元 ，60 万 亿 个 神经 突 触 以 及 它们 的 联接 体 。 神 经 
元 是 信息 处 理 的 基本 单元 。 如 图 6-2 所 示 ， 神 经 元 的 基本 结构 可 分 为 胞 体 和 突起 两 部 分 。 胞 
体 包括 细胞 膜 、 细 胞 质 和 细胞 核 ; 突起 由 胞 
体 发 出， 分 为 树 突 (dendrite) 和 轴 突 
(axon) 两 种 。 

树 突 较 多 ， 粗 而 短 ， 反 复 分 文 ， 逐 渐变 
细 。 树 突 具 有 接受 刺激 并 将 冲动 传 入 细胞 体 
的 功能 。 

轴 突 一 般 只 有 一 条 ， 细 长 而 均匀 ， 中 途 
分 支 较 少 ,末端 则 形成 许多 分 文 ， 每 个 分 文 
末梢 部 分 膨大 旦 球状 ， 称 为 突 触 小 体 。 轴 突 图 6-2 生物 神经 元 模型 示意 图 
的 主要 功能 是 将 神经 冲动 由 胞 体 传 至 其 他 神 
经 元 或 效应 细胞 。 轴 罕 传 时 神经 冲动 的 起 始 部 位 ， 是 在 轴 突 的 起 始 段 ， 沿 轴 膜 进行 传导 。 

突 触 是 一 个 神经 元 和 另 一 个 神经 元 连接 的 部 分 ， 由 罕 触 前 、 后 膜 以 及 两 膜 间 的 鹤 颖 一 突 
触 间隙 所 构成 。 胞 体 与 胞 体 、 树 突 与 树 突 以 及 轴 突 与 轴 突 之 间 都 有 突 触 形成 ， 但 常见 的 是 某 
神经 元 的 轴 突 与 另 一 神经 元 的 树 突 间 所 形成 的 轴 突 一 树 突 突 触 ， 以 及 与 胞 体形 成 的 轴 突 一 胞 









































体 突 触 。 
神经 元 的 基本 功能 是 通过 接受 、 整 合 、 传 导 和 输出 信息 实现 信息 交换 ， 具 有 兴奋 性 、 传 
导 性 和 可 塑性 。 


2. 人 工 神经 网 络 模型 

人 工 神 经 网 络 模型 是 一 种 模仿 动物 神经 网 络 行为 特征 ， 进 行 分 布 式 并 行 信息 处 理 的 数学 
模型 ， 是 生物 神经 网 络 的 抽象 、 简 化 和 模拟 ， 反 映 了 生物 神经 网 络 的 基本 特性 。 人 工 神经 网 
络 由 大 量 处 理 单元 互 连 而 成 ， 依 靠 系 统 的 复杂 程度 ， 通 过 调整 内 部 大 量 节 点 之 间 相 互 连 接 的 
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关系 ， 从 而 达到 处 理 信 息 的 目的 。 人 工 神 经 网 络 通常 具有 自学 习 和 自 适应 的 能 力 ， 可 以 通 
预先 提供 的 一 批 相互 对 应 的 输入 一 输出 数据 ， 分 析 和 掌握 其 中 蕴含 的 潜在 规律 ， 并 根据 这 
规律 ， 用 新 的 输入 数据 来 推算 输出 结果 。 这 一 学 习 分 析 的 过 程 被 称 为 “训练 ”。 

人 工 神经 元 是 组 成 人 工 神经 网 络 的 基本 单元 ， 一般 具有 三 个 要 素 : 

1) 具有 一 组 突 触 或 联结 ， 神 经 元 i 和 神经 元 j 之 间 的 联结 强度 用 wy 表示 ， 称 为 权 值 。 

2) 具有 反映 生物 神经 元 时 空 整 合 功能 的 输入 信号 累加 器 。 

3) 具有 一 个 激励 函数 用 于 限制 神经 元 的 输出 和 表征 神经 元 的 响应 特征 。 

一 个 典型 的 人 工 神 经 元 模型 如 图 6-3 所 示 。 

其 中 x(j=1，2,，…N) 为 神经 元 i 的 输 
入 信号 ，wi; 为 突 触 强 度 或 联结 权 值 。w 是 神 
经 元 i 的 净 输入 ， 是 输入 信号 的 线性 组 合 。 
0; 为 神经 元 的 国 值 ， 也 可 用 偏差 5 表示， vw 是 
经 偏差 调整 后 的 值 ， 称 为 神经 元 的 局 部 感 
应 区 。 


过 
些 

















二 > 人 图 6-3 ”神经 元 模型 
v;=u;-0;=u;+b, 
有 所. ) 是 神经 元 的 激励 函数 ，y; 是 神经 元 i 的 输出 
yi=f(v;) 
激励 函数 的 形式 有 很 多 种 ， 常 用 的 基本 激励 函数 有 以 下 三 种 。 
(1) 离散 型 激励 函数 ”又 可 分 为 单 极 性 和 双 极 性 两 种 ， 单 极 性 的 离散 激励 函数 可 选 为 
阶 跃 函数 ， 如 图 6-4 所 示 。 





_/1 if(v 宇 0) 
Av |, else 
双 极 性 的 离散 激励 子 数 可 选 为 符号 函数 ， 如 图 6-5 所 示 。 


1 if(v 宇 0 
f=se(w)= (I 


1 else 


(Do)h f (0) 











© 
Sy 

| 
a 


图 6-4 ” 阶 跃 函数 图 6-5 符号 函数 


(2) 分 段 线性 函数 单 极 性 分 段 线性 函数 如 图 6-6 所 示 。 
1 if(v 宇 +1) 
| if(0<v<1) 
0 if(v<0) 
双 极 性 分 段 线性 函数 如 图 6-7 所 示 。 
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+1 区 vv 过 +1) 
f(v)= 47 if(-1<v<1) 
=] if(v<-1) 
f (0) 
1 
4 5 六 
图 6-6 单 极 性 分 段 线性 孔 数 图 6-7 双 极 性 分 段 线 性 函数 











(3) Sigmoid 函数 ”也 称 为 S 型 函数 ， 如 图 6-8 所 示 。 由 于 其 具有 音调、 连续、 光滑 、 
处 处 可 导 等 优点 ， 是 目前 人 工 神 经 网 络 中 最 常 使 用 的 激励 函数 。 它 也 有 单 极 性 和 双 极 性 两 种 
形式 。 单 极 性 函数 形式 为 

















1 
J 
双 极 性 Sigmoid 函数 可 采用 双 曲 正切 函数 表示 ， 如 图 6-9 所 示 。 
1—e-® 
才思 
1+e 
f (0) 
a 
0 区 
图 6-8 Sigmoid 函数 图 6-9 双 曲 正切 函数 





除 上 述 几 种 常用 的 激励 函数 外 ， 神 经 元 的 激励 函数 还 可 根据 所 要 解决 的 具体 问题 来 设计 
特定 的 激励 函数 形式 。 

将 若干 相同 的 或 不 同 的 神经 元 采用 一 定 的 连接 方式 组 成 网 络 ， 即 可 构成 人 工 神经 网 络 。 
人 工 神 经 网 络 的 种 类 很 多 ， 从 网 络 基 本 结构 来 看 ， 大 致 可 分 为 前 向 型 网 络 和 反馈 型 网 络 。 前 
向 型 网 络 的 典型 代表 是 BP 神经 网 络 ， 反 馈 型 网 络 的 典型 代表 是 Hopfield 网 络 。 还 有 一 部 分 
网 络 是 在 这 二 者 基础 上 派生 出 来 的 新 型 网 络 。 另 外 ， 还 有 一 些 学 者 结合 其 他 学 科 的 知识 提出 
了 大 量 新 型 复合 神经 网 络 模型 。 不 同 的 神经 网 络 具有 不 同 的 结构 和 特点 ， 适 用 于 求解 不 同 的 
工程 问题 。 

3.， 人 工 神经 网 络 的 学 习 方 式 

人 工 神经 网 络 的 最 大 优点 之 一 就 是 网 络 具有 学 习 能 力 ， 神 经 网 络 可 以 通过 向 环境 学 习 获 
取 知 识 来 改进 自身 性 能 。 性 能 的 改善 通常 是 按照 某 种 预订 的 度量 ， 通 过 逐渐 修正 网 络 的 参数 
(如 权 值 、 阔 值 等 ) 来 实现 的 。 根 据 环境 提供 信息 量 的 不 同 ， 神 经 网 络 的 学 习 方 式 大 致 可 分 
为 3 种 。 

(1) 监督 学 习 (有 导师 学 习 ) “这 种 学 习 方式 需要 外 界 环境 给 定 一 个 “导师 ”信和 号 ， 
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可 对 一 组 给 定 输入 提供 期 望 的 输出 。 这 种 已 知 的 输入 /输出 数据 称 为 训练 样本 集 ， 神 经 网 络 
根据 网 络 的 实际 输出 与 期 望 输出 之 间 的 误差 来 调节 网 络 的 参数 ， 实 现 网 络 的 训练 学 习 过 程 ， 
其 原理 框图 如 图 6-10 所 示 。 

(无 导师 学 习 ) 这 人 
种 学 习 方 式 外 界 环 境 不 提供 “导师 ” 信 
号 ， 只 规定 学 习 方式 或 某 些 规则 ， 具 体 
的 学 习 内 容 随 系统 所 处 环境 ( 即 输入 信和 号 
情况 ) 而 异 ， 网 络 根据 外 界 环 境 所 提供 
数据 的 某 些 统计 规律 来 实现 自身 参数 或 图 6-10 监督 学 习 
结构 的 调节 ， 从 而 表示 出 外 部 输入 数据 
的 某 些 固有 特征 。 系 统 可 以 自动 发 现 环 境 特征 和 规律 性 ， 具 有 更 近似 人 脑 的 功能 ， 其 原理 框 
图 如 图 6-11 所 示 。 

(3) 再 励 学 习 〈 强 化 学 习 ) 这 种 学 习 方 式 介 于 监督 学 习 和 无 监督 学 习 之 间 ， 外 部 环境 
对 网 络 输出 给 出 一 定 的 评价 信息 ， 网 络 通过 强化 那些 被 肯定 的 动作 来 改善 自身 的 性 能 ， 其 原 
理 框图 如 图 6-12 所 示 。 















































输出 动作 
输入 SS 
学 习 系统 输入 状态 
图 6-11 无 监督 学 习 图 6-12 ”再 励 学 习 





常见 的 学 习 规则 有 Hebb 学 习 、 纠 错 学 习 、 基 于 记忆 的 学 习 、 随 机 学 习 和 竞争 学 习 等 。 

Hebb 学 习 规 则 是 最 古老 也 是 最 著名 的 学 习 规则 ， 是 为 了 纪念 神经 心理 学 家 Hebb 而 命名 
的 ， 主 要 用 于 调整 神经 网 络 的 突 触 权 值 ， 可 概括 为 : 

1) 如 果 一 个 突 触 (连接 ) 两 边 的 两 个 神经 元 被 同时 〈 即 同步 ) 激活 ， 则 该 突 触 的 能 量 
就 被 选择 性 地 增加 。 

2) 如 果 一 个 突 触 ( 连接) 两 边 的 两 个 神经 元 被 异步 激活 ， 则 该 突 触 的 能 量 就 被 有 选择 
地 消 弱 或 者 消除 。 

纠 错 学 习 也 称 为 Delta 规则 或 Widrow-Hoff 规则 ， 学 习 过 程 通 过 反复 调整 突 触 权 值 使 代 
价 函 数 达 到 最 小 或 使 系统 达到 一 个 稳定 状态 来 完成 。 

基于 记忆 的 学 习 主 要 用 于 模式 分 类 ， 在 基于 记忆 的 学 习 中 ,， 过 去 的 学 习 结果 被 储存 在 一 
个 大 的 存储 器 中 ， 当 输入 一 个 新 的 测试 向 量 时 ， 学 习 过 程 就 将 该 测试 向 量 归 到 已 存储 的 某 个 
类 中 。 

随机 学 习 算 法 也 称 为 Boltzmann 学 习 规 则 ， 是 为 了 纪念 Ludwig Boltzmann 而 命名 的 。 该 
学 习 规 则 是 由 统计 力学 思想 而 来 的 ， 在 此 学 习 规 则 基础 上 设计 出 的 神经 网 络 称 为 Boltzmann 
机 ， 其 学 习 算 法 实质 就 是 模拟 退火 算法 。 

竞争 学 习 规 则 有 三 项 基本 内 容 : 

1) 一 个 神经 元 集合 ， 除 了 某 些 随机 分 布 的 突 触 权 值 之 外 ， 所 有 的 神经 元 都 相同 ， 因 此 
对 给 定 的 输入 模式 集合 有 不 同 的 响应 。 
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2) 每 个 神经 元 的 能 量 都 被 限制 。 

3) 一 个 机 制 : 允许 神经 元 通过 竞争 对 一 个 给 定 的 输入 子 集 作 出 响应 。 记 得 葛 争 的 神经 
元 称 为 全 胜 神 经 元 。 

在 竞争 学 习 中 ， 神 经 网 络 的 输出 神经 元 之 间 相 互 竞 争 ， 在 任 一 时 间 只 能 有 一 个 输出 神经 
元 是 活性 的 ， 而 在 基于 Hebb 学 习 的 神经 网 络 中 几 个 输出 神经 元 可 能 同时 是 活性 的 。 





6.4 BP 神 经 网 络 








BP 神经 网 络 是 研究 最 早 、 应 用 最 广 的 神经 网 络 之 一 。 它 是 一 种 典型 的 前 向 型 神经 网 络 。 
除 BP 神经 网 络 外 ， 上 典型 的 前 向 型 网 络 还 包括 RBF ( 径 向 基 函 数 ) 神经 网 络 和 CMAC (小 脑 
模型 控制 器 ) 神经 网 络 等 。 

典型 的 三 层 前 向 网 络 结构 如 图 6-13 所 示 ， 网 络 
是 具有 一 个 隐藏 层 和 一 个 输出 层 的 全 连接 网 络 。 在 
分 层 网 络 中 ， 神 经 元 (节点 ) 以 层 的 形式 组 织 ， 输 
入 层 的 源 节点 提供 激活 模式 的 输入 向 量 ， 构 成 第 二 
层 (第 一 隐藏 层 ) 神经 元 的 输入 信号 ， 最 后 的 输出 
层 给 出 相应 于 源 节点 的 激活 模式 的 网 络 输出 。 网 络 。 ce 
各 神经 元 之 间 不 存在 反馈 ， 通常 又 称 为 前 馈 网 络 。 源 节 点 输入 层 。” 隐藏 神经 元 层 神经 元 输出 层 

20 世纪 70 年 代 ，P. Werbos 在 其 博士 论文 中 ， 和 
首次 谈 到 了 BP (Back Propagation， 反问 传播 ) 的 
概念 。 直 到 1985 年 ，Rumelhart 等 人 将 BP 理论 在 神经 网 络 中 实现 ， 提 出 了 最 为 著名 的 前 向 
型 多 层 反 向 传播 算法 ， 网 络 的 学 习 包 括 正 向 传播 (计算 网 络 输 出 ) 和 有 反 疝 传播 (实现 权 值 
调整 ) 两 个 过 程 ， 因 此 ， 准 确 地 讲 ， 称 之 为 Error BP 网 络 更 为 合适 。 

从 网 络 结构 上 看 ，BP 神经 网 络 属于 前 向 型 神经 网 络 ; 从 网 络 训练 过 程 上 看 ，BP 神经 网 
络 属于 有 监督 神经 网 络 ; 从 学 习 算 法 来 看 ，BP 神经 网 络 采用 的 是 Delta 学 习 规 则 ; 而 从 隐藏 
层 激 活 函 数 类 型 上 ，BP 神经 网 络 通常 采用 Sigmoid 函数 。 


6.4.1 网 络 结构 


图 6-14 给 出 了 含有 一 个 隐藏 层 的 BP 神经 网 络 结构 ， 其 中 ，i 为 输入 层 神经 元 数 ，X = 
[x1，x2，…x;] 为 网 络 的 输入 向 量 ，/ 为 隐藏 层 神经 元 数 ， 为 输出 层 神经 元 数 ， 写 作 i-j- 
结构 。[w] 表示 输入 层 到 隐藏 层 的 权 值 矢量 ， 
[wx] 表示 隐藏 层 到 输出 层 的 权 值 矢量 。 

在 实际 应 用 中 ， 网 络 的 输入 层 和 输出 层 的 节 
点 数 根据 训练 样本 对 的 形式 来 确定 ， 而 对 于 隐藏 
层 的 数量 及 各 隐藏 层 节点 的 数量 并 没有 严格 的 设 
计 准则 ， 通 常 根据 所 解决 问题 的 复杂 程度 来 设 
计 。 一 般 来 说 ， 隐 藏 层 的 数量 和 隐藏 层 节点 数量 
越 多 ， 网 络 的 问题 求解 能 力 越 强 ， 但 同时 也 导致 
训练 参数 增多 ， 训 练 过 程 中 容易 出 现 训练 失败 或 0 BP 
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训练 时 间 过 长 等 现象 。 另 外 ， 由 于 已 有 定理 证 明 (Cybenko 1988) ， 任 意 函 数 可 以 被 一 个 有 
三 层 单元 的 网 络 以 任意 精度 逼近 ， 因 此 ， 为 了 减少 网 络 训练 参数 ， 一 般 选 择 三 层 BP 神经 网 
络 求解 工程 问题 。 但 该 定理 只 是 证 明了 网 络 的 存在 性 ， 并 没有 指出 如 何 针 对 具体 问题 来 设计 
所 需 的 三 层 网 络 结构 。 在 实际 应 用 中 ， 也 并 不 一 定 非 要 采用 三 层 的 网 络 结构 ， 特 别 对 于 复杂 
问题 的 求解 ， 适 当 增加 隐藏 层 的 数量 ， 也 有 可 能 提高 网 络 的 求解 效率 。 


6.4.2 网 络 学 习 算 法 


BP 算法 的 训练 过 程 包括 正 向 传播 和 反 向 传播 两 部 分 。 借 助 于 有 监督 (Supervised Learn- 
ing) 网 络 的 学 习 思 想 ， 在 正 向 传播 过 程 中 ， 由 导师 对 外 部 环境 进行 了 解 并 给 出 期 望 的 输出 
信号 〈 理 想 输出 ) ， 而 网 络 自身 的 输入 信息 经 隐藏 层 ， 传 向 输出 层 ， 信 息 通过 逐 层 处 理 ， 得 
到 实际 输出 值 ， 当 理想 输出 和 实际 输出 存在 差异 〈 某 个 精度 上 ) ， 网 络 转 至 反 向 传播 过 程 。 
其 基本 思想 是 借助 非 线性 规划 中 的 “梯度 下 降 法 ” (Gradient Descent) ， 即 采用 梯度 搜索 技 
术 ， 认 为 参数 沿 目标 函数 的 负 梯 度 方向 改变 ， 可 以 使 网 络 理想 输出 和 实际 输出 的 误差 均 方 差 
(RMS) 达到 最 小 。 i 2 

以 BP 网 作为 通用 台 近 器 为 例 ， 给 出 其 对 非 线性 函数 | 和 






































(系统 ) 进行 台 近 的 学 习 过 程 。 图 6-15 为 允 近 器 结构 图 。 1 
其 中 ,为 采样 时 间 ， wu(k) 为 控制 信号 ， 直 接 作用 于 被 控 a (0 
对 象 ，y() 为 过 程 的 实际 输出 (理想 输出 ， 称 为 导师 信 BP 网 


号 ) ， 两 者 共同 作为 BP 逼近 器 的 输入 信号 。 罗 (kt) 为 BP 
网 络 的 实际 输出 ， 将 理想 输出 和 网 络 实际 输出 的 误差 作为 。 图 6-15 BP 神经 网 络 允 近 器 
允 近 屁 的 调整 信号 e(%)。 

(1) 正 向 传播 ”计算 网 络 的 实际 输出 。 隐 茂 层 神经 元 (对 应 第 j 个 ) 输入 为 所 有 输入 
神经 元 的 加 权 之 和 ， 即 








Xj; 二 2 wr 
其 中 ,i=2, 代表 输入 层 的 两 个 神经 元 。 方 程 仪 给 出 一 般 表达 式 ， 以 下 不 再 做 特殊 
说 明 。 
隐藏 层 神经 元 (对 应 第 7 个) 的 输出 x 为 和 的 Sigmoid 函数 ， 即 





二 1 
Wh 1+e 
则 
OX 一 
一 =- 一 =x(1-z)) 
O%; (1l+e™™)? J J 
输出 层 神 经 元 的 输出 为 


yn(k) by Wj 


本 例 为 单 输出 网 络 ， 权 值 wi 中 =1， 代 表 输 出 层 仅 有 一 个 神经 元 。 
调整 信号 为 理想 输出 和 网 络 实际 输出 的 误差 ， 即 
e(hk)=y( hk) -yk) 
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建立 目标 函数 ， 即 误差 性 能 指标 函数 ， 表 示 为 
J=7e (k)? 
(2) 反 向 传播 ”采用 Delta 学 习 算 法 ， 调 节 各 层 之 间 的 权 值 矢量 。 首 先 调节 输出 层 到 隐 
藏 层 的 权 值 矢量 wx ， 设 相 邻 两 次 采样 时 间 对 应 的 变化 量 为 Awj,， 则 
9y (天 
Axi = 一 7 * e(k) 2 
求解 偏 导 的 过 程 称 为 连锁 法 (Chain Rule) 。 
式 (6-1) 中 , ne [0, 1] 称 为 学 习 效 率 ， 或 步 长 ， 通 常 取 m=0.5。 
则 k+1 时 刻 ， 网 络 的 权 值 调整 为 
wi ktl)= wi ke) +Aw 
为 了 避免 权 值 的 学 习 过 程 发 生 震 荡 、 收 敛 速度 慢 ， 引 入 动量 因子 a, 修正 后 的 权 值 矢量 
表示 为 


m7 * e(k) “| (6-1) 








wa( ktl1)= wa k)+Aw ta( wh) -wn k-1) ) (6-2) 

式 (6-2) 表明 ， 下 一 时 刻 的 权 值 不 但 与 当前 时 刻 权 值 有 关 ， 同 时 追加 了 上 一 时 刻 权 值 
变化 对 下 一 时 刻 权 值 的 影响 ， 该 方法 被 称 
为 BP 的 改进 算法 ，aws [0，1] 也 叫做 惯 
性 系数 、 平 滑 因 子 或 阻尼 系数 ( 减 小 学 习 


下 和 网络 各 连接 权 值 睦 初 始 随机 值 | 
过 程 的 振荡 趋势 )， 通常 取 a=0.05; (wi ann | 


初始 化 网 络 参数 ， 当 前 样本 序号 /=0， 样 本 数量 为 N 








() -wa(k-1) ) 称 为 惯性 项 。 - 
到 输入 层 的 权 值 矢量 w 的 学 习 算 法 为 


; 民 和 输出 层 点 的 输 
) oyn(k) 计算 隐藏 层 和 输出 层 各 节点 的 输出 什 


09/ 
人 Re —— 二 . k 
Wy OWw;; Wl Ow, 


Uy y 
, i 络 实 际 -本 想 上 
其 中 Oya(k) Oy(k) Ox ox 计算 网 络 实际 输出 与 理想 出 处 的 偏差 
ee OWw.. Ox . OX Do “六 


ji . y 调整 网 络 各 层 之 间 的 连接 权 值 


er 


k+1 时 刻 ， 网 络 的 权 值 为 
wi kt+1)= wk) +Awta( wa(k) -wa( hk-1)) ! 、 

在 程序 设计 中 ， 对 所 有 权 值 矢量 赋 以 > 
随机 任意 小 值 ， 预 先 设计 最 大 迭代 次 数 ， 
并 给 出 网 络 训练 的 最 终 目 标 ， 如 J= 10-™， 




















N 是 否 
使 网 络 跳出 递归 循环 。BP 学 习 算 法 的 程序 基 末 人 
框图 如 图 6-16 所 示 。 。 
网 络 各 连接 权 值 的 初始 值 必须 赋 较 小 
的 随机 数 ， 而 不 能 将 初始 权 值 都 设置 为 相 生来 
同 的 值 ， 和 否则 网 络 不 具有 通 近 能 力 ， 导 致 图 6-16 BP 算法 程序 框图 
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训练 失败 。 另 外 ， 训 练 的 结束 条 件 一 般 有 两 个 ， 一 个 是 达到 预先 设计 最 大 迭代 次 数 ， 另 一 个 
是 误差 小 于 给 定 值 。 如 果 训 练 算法 因 训 练 误差 小 于 指定 值 而 退出 训练 程序 ， 则 网 络 训练 成 
功 ; 如 果 因 达到 预先 设计 最 大 迭代 次 数 而 退出 训练 程序 ， 则 网 络 训练 有 可 能 失败 。 网 络 训练 
失败 一 方面 可 能 是 网 络 结构 设计 不 合理 导致 的 ， 此 时 需要 调整 隐藏 层 数 量 或 隐藏 层 节 点 数 
量 ; 另 一 方面 也 可 能 是 初始 权 值 设置 不 合理 导致 的 ， 因 为 每 次 训练 网 络 初始 化 的 权 值 都 是 不 
同 的 ， 因 此 ， 此 时 只 需 重新 训练 网 络 就 有 可 能 训练 成 功 。 

网 络 的 训练 样本 由 已 知 数据 构成 ， 在 设计 网 络 时 ， 要 预 留 出 一 部 分 已 知 样本 作为 训练 样 
本 ,训练 样 本 不 参与 网 络 训练 ， 作 为 检测 网 络 工作 性 能 使 用 。 


6.4.3 BP 网 络 的 改进 算法 


上 节 所 描述 的 训练 方法 ， 称 作 具 有 阻尼 项 (惯性 项 ) 的 权 值 调整 算法 ， 它 是 在 基本 误 
差 反 向 传播 算法 上 加 入 了 阻尼 项 而 产生 的 ， 能 够 避免 权 值 的 学 习 过 程 中 发 生 震 荡 ， 提 高 收敛 
速度 ， 当 阻尼 系数 a=0 时 ， 训 练 算法 则 旷 化 为 基本 的 误差 反 向 传播 训练 方法 。 误 差 反 向 传 
播 训练 方法 虽然 能 够 按照 梯度 下 降 的 速度 减 小 训练 误差 ， 但 自身 也 有 一 定 的 缺点 和 不 足 ， 针 
对 不 同 的 缺点 ， 学 者 还 提出 了 许多 其 他 改进 方法 ， 下 面 介绍 几 种 常用 的 方法 。 

1. 变 步 长 算法 

学 习 算 法 中 ， 学 习 步 长 7 的 选择 对 训练 性 能 会 产生 一 定 影响 ， 当 学 习 步 长 7 设 定 较 大 
时 ， 网 络 权 值 调 整 量 较 大 ， 网 络 学 习 速 度 较 快 ， 但 过 大 的 学 习 步 长 会 引起 振荡 ， 导 致 网 络 不 
稳定 ; 而 过 小 的 学 习 步 长 虽然 可 避免 网 络 的 不 稳定 ， 但 收敛 速度 会 较 慢 。 为 此 ， 可 采用 
“ 变 步 长 ”改进 算法 。 它 是 指 在 网 络 训练 中 ， 每 一 步 的 步 长 能 够 自 适应 地 改变 ， 而 不 是 仅 靠 
经 验 在 程序 初始 阶段 设 定 。 观 测 连 续 两 次 训练 的 误差 值 ， 如 果 误 差 下 降 则 增 大 学 习 率 ; 误差 
反弹 在 一 定 范围 内 ， 则 保持 步 长 ;误差 反弹 超过 一 定 限度 ， 则 减 小 步 长， 具体 描述 为 

IF E(t)<E,i, Xer THEN w(t+1)= 7(t) xXxin 
ELSE nm(t+1)= 7(t)xde 

其 中 ，Eii, 为 前 坎 迭 代 的 最 小 误差 ;er 为 反弹 许可 率 ; in 为 学 习 步 长 增加 率 ; de 为 学 
习 步 长 减 小 率 。 

为 了 简化 起 见 ， 也 可 在 网 络 训练 初期 选择 较 大 的 学 习 步 长 ， 而 随 着 训练 迭代 次 数 的 增 
加 ， 逐 渐 减 少 学 习 步 长 。 这 样 ， 在 网 络 训练 初期 可 获得 较 大 的 训练 速度 ， 网 络 能 够 以 较 快 的 
速度 收敛 ; 而 在 训练 末期 ， 学 习 步 长 较 小 ， 可 避免 网 络 振荡 ， 确 保 稳定 收敛 。 

2. 搜索 方法 的 改进 

梯度 下 降 搜索 只 利用 了 误差 函数 的 一 阶 偏 导数 信息 ， 为 了 提高 搜索 速度 ， 还 可 采用 牛顿 
法 、 共 固 梯 度 法 、 拟 牛顿 法 以 及 Levenberg-Marquardt 算法 等 替代 梯度 搜索 ， 提 高 网 络 的 训练 
速度 。 不 过 ， 牛 顿 法 设计 对 海 塞 和 矩阵 ( Hessian matrix) 及 其 道 阵 的 精确 求解 ， 导致 计算 量 
很 大 。 共 斩 梯 度 法 沿 着 共 斩 方 向 执行 搜索 ， 通 常 要 比 沿 着 梯度 下 降 方 向 收敛 速度 更 快 。 并 且 
由 于 共 斩 梯 度 法 并 没有 要 求 使 用 海 塞 和 矩阵 ， 所 以 在 大 规模 神经 网 络 中 可 以 获得 良好 的 优化 性 
能 。 拟 牛顿 法 比 梯度 下 降 和 共 斩 梯 度 法 收敛 更 快 ， 并 且 也 不 需要 确切 地 计算 海 塞 矩阵 及 其 逆 
矩阵， 也 是 一 种 高 效 的 训练 方法 。Levenberg-Marquardt 算法 ， 也 称 为 衰减 最 小 二 乘法 ， 该 算 
法 采用 平方 误差 和 的 形式 。 算 法 的 执行 也 不 需要 计算 具体 的 海 塞 矩阵 ， 仅 仅 使 用 梯度 向 量 和 
雅 可 比 矩 阵 。 对 于 使 用 平方 误差 和 函数 作为 误差 度量 的 神经 网 络 ， 该 算法 能 够 快速 完成 训练 
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过 程 。 但 对 于 大 型 数据 集 或 神经 网 络 ， 雅 可 比 矩 阵 会 变 得 十 分 巨大 ， 因 此 也 需要 大 量 的 内 
存 。 所 以 在 大 型 数据 集 或 神经 网 络 中 一 般 不 采用 Levenberg-Marquardt 算法 。 

3. 泛 化 性 能 的 提高 

神经 网 络 的 训练 过 程 使 得 网 络 对 训练 样本 的 输出 与 期 望 值 之 间 的 误差 变 小 ， 但 这 并 不 是 
神经 网 络 设计 和 训练 所 追求 的 真正 目标 。 衡 量 神经 网 络 性 能 的 重要 指标 是 其 泛 化 能 力 。 简 单 
地 说 ， 良 好 的 泛 化 能 力 是 指 对 未 参与 训练 的 样本 ， 网 络 的 输出 与 期 望 值 之 间 具 有 较 小 的 误 
差 。 相 反 ， 如 果 一 味 地 追求 训练 样本 误差 的 最 小 化 ， 会 导致 神经 网 络 出 现 过 学 习 现 象 ， 从 而 
恶化 网 络 的 泛 化 性 能 。 因 此 ， 如 何 提 高 网 络 的 泛 化 能 力 才 是 网 络 和 学 习 算 法 设计 的 关键 。 例 
如 ， 减少 训 练 的 迭代 次 数 有 时 可 以 避免 过 学 习 现 象 的 发 生 ， 从 而 可 改善 网 络 的 泛 化 能 力 。 另 
外 ， 训 练 样本 中 可 能 存在 一 定 的 噪声 污染 ， 样 本 中 的 噪声 有 时 对 网 络 泛 化 能 力 的 提升 也 会 起 
到 一 定 的 积极 作用 。 

另外 ， 选 择 其 他 类 型 的 扁平 激活 函数 ， 如 双 曲 正切 函数 代替 Sigmoid 函数 ， 也 可 以 在 一 
定 程度 上 提高 收敛 速度 。 在 实际 应 用 中 ， 可 根据 具体 的 工程 问题 ， 选 择 合适 的 训练 方案 。 由 
于 BP 神经 网 络 研究 较 早 ， 且 应 用 较为 成 熟 ， 因 此 网 络 的 改进 算法 有 许多 种 形式 ， 感 兴趣 的 
读者 可 参阅 相关 参考 文献 进行 学 习 。 


6. 4.4 ”BP 神经 网 络 的 特点 


BP 神经 网 络 的 层 与 层 之 间 采 用 全 连接 方式 ， 即 相 邻 层 的 任意 一 对 神经 元 之 间 都 有 连接 。 
同一 层 的 处 理 单元 (神经 元 ) 是 完全 并 行 的 ， 层 间 的 信息 传递 是 串 行 的 ， 由 于 层 间 节点 数 
目 要 远大 于 网 络 层 数 ， 因 此 是 一 种 并 行 推理 。 个 别 神经 元 的 损坏 或 异常 故障 ， 对 输入 输出 关 
系 产 生 的 影响 较 小 ， 因 此 网 络 具 有 很 好 的 容错 性 能 。 

BP 神经 网 络 的 突出 性 能 还 体现 在 其 具有 较 强 的 泛 化 能 力 ， 可 对 其 理解 为 : 中 用 较 少 的 
样本 进行 训练 时 ， 网 络 能 够 在 给 定 的 区 域内 达到 要 求 的 精度 ; @ 用 较 少 的 样本 进行 训练 时 ， 
网 络 对 未 经 训练 的 输入 也 能 给 出 合适 的 输出 ; 咏 当 神经 网 络 输入 矢量 带 有 噪声 时 ， 即 与 样本 
输入 矢量 存在 差异 时 ， 神 经 网 络 的 输出 同样 能 够 准确 地 呈现 应 有 的 输出 。BP 神经 网 络 对 测 
试 样本 的 输出 误差 能 够 在 一 定 程 度 上 评价 网 络 的 泛 化 能 

Kolmogorov 定理 证 明 ， 对 于 任意 ae>0， 存 在 一 个 结构 为 n-(2n+1)-m 的 三 层 BP 神经 网 
络 ， 能 够 以 任意 a? 误差 精度 内 逼近 连续 函数 , 刻 [0，1]" 一 R"。 而 对 于 多 层 BP 神经 网 络 ， 
理论 上 也 可 以 证 明 ， 只 要 采用 足够 多 的 隐 层 和 隐 层 节点 数 ， 利 用 扁平 函数 或 线性 分 段 多 项 式 
函数 作为 激活 函数 ， 可 以 对 任意 感 兴趣 的 函数 以 任意 精度 进行 和 逼近 ， 因 此 ， 多 层 前 向 网 络 是 
一 种 通用 的 逼近 器 。 但 对 于 特定 问题 ， 直 接 确定 网 络 的 结构 尚 无 理论 上 的 指导 ， 仍 需 根 据 经 
验 进行 试 凑 。 

了 的 超 曲面 可 能 存在 多 个 极 值 点 ， 按 梯度 下 降 法 对 网 络 权 值 进行 训练 ， 很 容易 陷入 局 部 
极 小 值 ， 即 收敛 到 初 值 附近 的 局 部 极 值 。 

由 于 BP 网 隐藏 层 采用 的 是 Sigmoid 函数 ， 其 值 在 输入 空间 中 无 限 大 的 范围 内 为 非 零 值 ， 
因而 是 一 种 全 局 台 近 网 络 。 也 正 是 由 于 BP 网 的 全 局 通 近 性 能 ， 每 一 次 样本 的 友 代 学 习 都 要 
重新 调整 各 层 权 值 ， 使 得 网 络 收敛 速度 慢 ， 难 以 满足 实际 工 况 的 实时 性 要 求 。 而 RBF 网 络 
所 采用 的 是 高 斯 基 函 数 ， 大 大 加 快 了 网 络 的 学 习 速 度 ， 适 合 于 实时 控制 的 要 求 ， 详 细 算 法 在 
下 一 节 给 出 。 













































































《157) 


99》 人 工 智能 技术 





目前 ，BP 网 络 已 在 模式 识别 、 图 像 处 理 、 函 数 拟 合 、 优 化 计算 、 软 测量 、 信 息 融 合 、 
机 器 人 等 领域 取得 了 广泛 的 应 用 。 下 面 以 模式 识别 应 用 (Pattern Recosnition ) 为 例 ， 给 出 一 
个 BP 网 在 模式 识别 中 的 应 用 实例 。 


6. 4. 5 神经 网 络 应 用 实例 解析 


在 现实 世界 中 ， 声 音 、 图 人像、 文字、 震动 、 温 度 等 都 以 各 种 模式 存在 着 ， 随 着 对 人 工 吞 
能 研究 的 深入 ， 人 们 希望 对 这 些 模式 的 描述 、 辨 识 、 分 类 和 解释 等 过 程 通过 计算 机 来 完成 。 
大 多 数 的 人 工 智 能 都 是 以 符号 为 基础 ， 在 此 意义 下 ， 可 以 将 图 像 、 声 音 等 变换 为 一 定 的 符号 
信息 ， 如 “0”“1” 等 数值 数据 ， 以 便 进行 信息 处 理 。 
【 例 6-1】 设 参考 模式 (或 称 模板 ) 为 四 输入 、 三 输出 的 样本 ， 如 表 6-1 所 示 ， 设 计 





























BP 神经 网 络 ， 并 计算 测试 样本 的 输出 。 测 试 样本 的 输入 模式 如 表 6-2 所 示 。 
表 6-1 参考 模式 表 6-2 测试 样本 的 输入 模式 
输入 
价 和 人 偷 出 
输 输出 0.950 0. 002 0.003 0. 002 
0. 003 0. 980 0. 001 0. 001 
1 0 0 0 1 0 0 
0. 002 0. 001 0.970 0. 001 
0. 001 0. 002 0. 003 0. 995 
0 1 0 0 0 0.5 0 
0. 500 0. 500 0. 500 0. 500 
1. 000 0. 000 0. 000 0. 000 
0 0 1 0 0 0 0.5 
0. 000 1. 000 0. 000 0. 000 
0. 000 0. 000 1. 000 0. 000 
0 0 0 1 0 0 1 
0. 000 0. 000 0. 000 1. 000 

















根据 表 6-1 给 出 的 输入 输出 样本 对 的 形式 ， 所 设计 的 BP 神经 网 络 输 入 层 应 含有 4 个 神 
经 元 ， 输 出 层 应 含有 3 个 神经 元 ， 如 果 设 计 含 有 一 个 隐 层 的 BP 神经 网 络 ， 隐 层 神 经 元 的 数 
量 可 根据 问题 的 复杂 程度 按 经 验 选取 ， 这 里 隐 层 选择 9 个 神经 元 ， 这 样 所 设计 的 BP 神经 网 
络 结构 为 4-9-3 的 结构 形式 。 

(1) BP 网 络 初始 参数 ”初始 网 络 权 值 矢 量 本 =[zwj] 和 了 瑟 =[oxp],， 取 [-1, +1] 之 
间 的 随机 值 ， 学 习 效率 为 了 =0. 50， 动 量 因子 为 ※w=0.05。 网 络 训练 的 最 终 目标 为 J/=10-”?。 

(2) 测试 结果 ”网络 训练 结束 后 ， 将 测试 样本 输入 到 网 络 中 ， 即 可 计算 测试 样本 的 输 
出 结果 。 表 6-3 为 测试 样本 及 结 








表 6-3 测试 样本 及 结果 








输入 输出 
0.950 0. 002 0. 003 0. 002 0.9645 0. 0032 0. 0179 
0. 003 0. 980 0. 001 0. 001 0. 0051 0. 4931 0. 0058 
0. 002 0. 001 0. 970 0. 001 0. 0059 0. 0037 0. 4948 
0. 001 0. 002 0. 003 0. 995 0. 0007 0. 0007 0. 9967 
0. 500 0. 500 0. 500 0. 500 0. 3529 0. 0914 0. 4390 
1. 000 0. 000 0. 000 0. 000 1. 0000 一 0. 0000 0. 0000 
0. 000 1. 000 0. 000 0. 000 -0. 0000 0. 5000 -0. 0000 
0. 000 0. 000 1. 000 0. 000 -0. 0000 一 0. 0000 0. 5000 
0. 000 0. 000 0. 000 1. 000 一 0. 0000 一 0. 0000 1. 0000 


图 6-17 为 BP 网 络 对 样本 训练 的 收敛 过 程 。 
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整个 网 络 的 训练 步 数 为 k=358， 程 序 在 
能 有 Vista 系统 的 PC 上 总 运行 平均 时 间 为 
0. 2810s。 从 仿真 结果 看 ， 该 改进 的 BP 神经 
网 络 具 有 很 好 的 双 近 非 线 性 系统 能 力 ， 样 本 
训练 的 收敛 过 程 也 很 快 。 

上 述 实 例 只 是 采用 BP 神经 网 络 解决 问 
题 的 简单 应 用 。 在 实际 应 用 中 ,为 了 得 到 良 
好 的 应 用 效果 ， 还 要 涉及 许多 数据 处 理 方面 
的 内 容 。 下 面 给 出 一 个 采用 BP 神经 网 络 进 
行 风 速 序列 预测 分 析 的 应 用 案例 分 析 设 计 
过 程 。 

【 例 6-2】 设 已 知 某 风 电场 的 历史 风速 
数据 ， 给 出 采用 BP 神经 网 络 实现 该 风电 场 风速 序列 1 步 预测 的 设计 方案 。 

(1) 风速 预测 的 意义 和 可 行 性 分 析 “ 随 着 化 石 燃 料 的 日 益 枯 竭 ， 以 及 环境 污染 的 日 益 
严重 ， 风 能 作为 一 种 无 污染 、 可 再 生 能 源 ， 得 到 世界 各 国 的 高 度 重 视 ， 风 力 发 电 成 为 世界 各 
国 重点 发 展 的 可 再 生 能 源 发 电 技 术 之 一 。 目 前 ， 开 发 和 利用 风能 的 主要 形式 是 大 规模 并 网 风 
力 发 电 。 风 具有 波动 性 、 间 歇 性 、 低 能 量 密度 等 特点 ， 因 此 风电 属于 一 种 间歇 性 能 源 ， 具 有 
很 强 的 随机 性 和 不 可 控 性 ， 其 输出 功率 的 波动 范围 通常 较 大 ， 速 度 较 快 ， 导 致电 网 调 峰 、 无 
功 及 电压 控制 十 分 困难 。 风 电 穿 透 功率 超过 一 定 值 之 后 ， 会 严重 影响 电能 质量 和 电力 系统 的 
和 运行。 这些 因素 给 电网 的 安全 稳定 及 正常 调度 带 来 新 的 问题 和 挑战 。 因 此 ， 风 电 并 网 的 技术 
问题 一 直 制 约 着 风能 的 利用 和 发 展 。 

风速 预测 是 解决 上 述 问题 的 关键 技术 之 一 。 对 风电 场 的 风速 进行 有 效 预 测 ， 进 而 根据 风 
机 的 功率 曲线 预测 其 功率 出 力 ， 将 使 电力 调度 部 门 能 够 提前 根据 风电 出 力 变化 及 时 调整 调度 
计划 ， 从 而 保证 电能 质量 ,减少 系统 的 备用 容量 ,降低 电力 系统 运行 成 本 ， 提 高 风电 穿 透 功 
率 极限 ,减轻 风电 对 电网 的 影响 。 

另外 ， 由 于 风速 序列 决定 于 自然 界 的 气象 规律 ， 其 自身 列 含 着 内 在 规律 性 ， 这 决定 了 风 
速 预测 的 可 行 性 。 由 于 气象 系统 的 复杂 非 线性 ， 一 般 认为 风速 时 间 序 列 具有 短期 可 预测 、 而 
长 期 不 可 预测 性 。 因 此 ， 对 风速 序列 进行 短期 预测 分 析 具 有 可 行 性 。 
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图 6-17 BP 网 收敛 过 程 


























(2) 训练 样本 构成 ”预测 结果 的 最 终 性 表 6-4 训练 样本 对 
能 不 仅 取决 于 网 络 结构 及 学 习 算 法 ， 还 与 数 输入 输出 
据 的 预 处 理 方 式 方法 有 重要 的 关系 。 例 如 ， Nl Ky 
设 风速 的 历史 数据 为 x| ,x,，,... ，xw， 网 络 ee 机 


训练 样本 的 构造 方式 对 预测 性 能 有 着 重要 的 
影响 。 一 般 可 认为 被 预测 的 风速 数据 与 之 前 
5 个 已 知 数据 有 关 ， 则 可 构造 如 表 6-4 所 示 的 训练 样本 对 。 

其 中 , 大 的 选取 应 适中 ， 过 小 的 大 值 会 造成 预测 信息 的 丢失 ， 不 利于 预测 性 能 的 提高 ， 
过 大 的 值 会 增加 预测 中 的 宛 余 信息 ， 同 样 不 利于 预测 性 能 的 提高 。 

根据 表 6-4 的 训练 样本 ， 可 构造 大 个 输入 工人 个 输出 的 预测 网 络 结构 ， 隐 层 既 可 选 1 个 ， 
也 可 选 多 个 。 多 隐 层 网 络 具 有 更 强 的 逼近 能 力 ， 但 网 络 训练 参数 较 多 。 
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(3) 网 络 的 训练 与 预测 “ 当 网 络 的 激励 函数 选择 Sigmoid 函数 时 ， 一 般 要 求 输入 输出 数 
据 应 在 (0，1) 之 间 。 如 果 数 据 不 在 该 范围 内 ， 可 采用 归 一 化 的 方法 将 数据 映射 到 (0，1) 
之 间 。 归 一 化 的 方法 有 很 多 ， 例 如 ， 可 以 采用 将 所 有 数据 除 以 最 大 值 的 方式 实现 ， 也 可 采用 
下 列 方式 实现 








Xi Xmin 


和 NX 


max min 


其 中 ,x 为 x; 归 一 化 后 的 值 ，%is、 和 xi 分 别 为 数据 序列 的 最 大 值 和 最 小 值 。 

利用 归 一 化 后 的 训练 样本 集 对 所 构建 的 网 络 进行 训练 ， 训 练 完 成 后 ， 将 (xy_p41， 
xw-ki1，"…， XN) 输入 到 网 络 中 ， 对 N+1 时 刻 风速 进行 预测 。 待 得 到 N+1 时 刻 的 真实 值 
xwil 后 ， 将 xw+ 加 入 到 已 知 数据 集中 ， 并 将 x 从 已 知 数据 集中 移出 ， 保 证 已 知 数据 集中 数 
据 量 不 变 ， 并 按照 表 6-4 重新 构建 训练 样本 ， 利 用 所 构建 的 新 样本 集 对 网 络 重 新 训练 ， 按 照 
同样 的 方式 实现 对 N+2 时 刻 风速 进行 预测 ， 依 次 滚动 进行 ， 从 而 完成 风速 序列 的 一 步 在 线 
预测 分 析 。 

上 述 预测 过 程 中 ， 及 时 将 获取 到 的 真实 值 加 入 到 样本 集中 ， 保 证 网 络 训练 过 程 中 信息 的 
持续 更 新 ， 有 助 于 提高 网 络 的 预测 性 能 。 


6.5 RBF 神经 网 络 


RBF (Radial Basis Function， 和 从 问 基 水 数 ) 网 络 的 理论 与 径 向 基 区 数理 论 有 着 密切 的 联 
系 ， 因 而 有 较为 坚实 的 数学 基础 。RBF 网 络 结构 简单 ， 为 具有 单 隐 层 的 三 层 前 向 网 络 ， 网 
络 的 第 一 层 为 输入 层 ， 将 网 络 与 外 界 环 境 连 结 起 来 ;第 二 层 为 径 向 基层 (隐藏 层 )， 其 作用 
是 输入 空间 到 隐 层 空间 之 间 进 行 非 线 性 变换 ; 第 三 层 为 线性 输出 层 ， 为 作用 于 输入 层 的 信号 
提供 响应 。 


6. 5. 1 径 向 基 范 数 
RBF 是 数值 分 析 中 的 一 个 主要 研究 领域 ， 该 技术 就 是 要 选择 一 个 函数 具有 下 列 形 式 ; 

















I 
F(x)= Dwp( x- cil) (6-3) 
i=1 


其 中 ，{p( x-e; |) li=1, 2,…, 四 是 7 个 任意 函数 的 集合 ， 称 为 径 向 基 沁 数 ，; 
| … 中 表示 范 数 ， 通 常 是 欧 几 里 德 范 数 ， 数据 c; 与 x 具有 相同 的 维 数 ， 表 示 第 i 个 基 函 数 的 
中 心 ， 当 * 远离 c 时 ，gp (x-eci |‖) 很 小 ， 可 以 近似 为 零 。 实际 上 ， 只 有 当 p(x-e; 1) 大 
于 某 值 (例如 0.05) 时 ， 才 对 相应 的 权 值 w 进行 修正 。 

典型 的 径 向 基 册 数 包括 : 

(1) 多 二 次 (Multiquadrics) 了 因数 


P(x)= (x tp ) 7 p>0,xeR 
(2) 道 多 二 次 (Inverse multiquadrics) 国 数 
1 





p(X)= | p>0,xeR 
(x HP ) 7 


(160) 














(3) 高 斯 (Gauss) 函数 





x 
pl) -op |- 


(4) 薄板 样 条 


p(%)= = 
函数 的 曲线 形状 如 图 6-18 所 示 。 


Multiquadrics Function 


(Thin plate spline ) 


o>0,xeR 


函数 


o>0,xeR 


Inverse multiquadrics Function 
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oF \、 2 08F / \ - 
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sr 、\ / 0.7F 1 \ 了 
SS 外 \ / E06 1 
可 \ / / : 

对 6 NA / 了 局 0.5 ; \ 到 
G so x 4 -] 904 / \ - 
N / / A 
4 \ / 本 0.3r / \ 本 

去 A ee, Nx 

= 二 上 a 可 
N 2 Rs ~ 
2r 让 a 可 0.1 广 一 全 
1 1 1 1 TD | 1 1 0 1 1 | | | 1 1 1 
-10 -8 -6 -4 -2 0 2 4 6 8 10 -10 -8 -6 -4 一 0 2 4 6 8 10 

Input x Input x 
a) 多 二 次 函数 b) 道 多 二 次 函数 


Thin plate spline Function 








Gauss Function 
T 



































| 
2 ] 
人 4 
Input x Input x 
c) 高 斯 函数 d) 薄板 样 条 函数 
图 6-18” 径 向 基 函 数 曲 线形 状 
由 于 Gauss 函数 形式 简单 、 径 向 对 称 、 解 析 性 和 光滑 性 好 ， 即 便 对 于 多 变量 输入 也 不 增 
加 太 多 复杂 性 ， 一 般 选 取 Gauss 函数 作为 RBF 神经 网 络 的 径 问 基 水 数 。 表 示 为 
| x-c; | . 
gi(%)= gi( || x-c; || )=exp| — 7 t= 2 .1 
207; 
这 里 ，o, 为 第 个 感知 的 变量 ， 它 决定 了 该 基 郴 数 围 绕 中 心 点 的 宽度 。7 为 隐藏 层 激 活 


函数 的 个 数 。g,(x) 在 c; 处 有 一 个 唯一 的 最 大 值 ， 随 着 


零 。 对 于 给 定 的 输入 x 


eR"， 只 


™ 





一 小 部 分 靠近 Ci 中 心 的 被 激活 o 


| x-ci | 的 增 大 ，g;(x) 迅速 衰减 到 
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6.5.2 径 向 基 范 数 网 络 结构 


RBF 神经 网 络 的 基本 思想 是 : 径 向 基 荫 数 作为 隐 单 元 的 “ 基 ”,， 构成 隐 舍 层 空间 ， 通 过 
输入 空间 到 隐 层 空间 之 间 的 非 线性 变换 ， 将 低 维 的 模式 输入 数据 变换 到 高 维 空间 ， 使 低 维 空 
间 线 性 不 可 分 转换 到 高 维 空间 的 线性 可 分 。 

由 式 (6-3) ，RBF 网 络 输出 函数 表示 为 (对 应 第 个 输出 神经 元 ): 





I 
F(x) = Dwigi(x) k=1,2,.…,n 
i=1 


其 中 , 为 输入 变量 ,对 = (xz ，x2，…，%)! eR"; m 为 输入 神经 元 个 数 ; 下 为 输出 
层 权 矢量 ， 玉 = (wi ，w2，…，w1) eR'; 了 为 径 向 基 峭 数 的 个 数 (中 心 的 个 数 )。RBF 网 络 
结构 图 如 6-19 所 示 。 

从 图 6-19 可 以 看 出 ,输入 层 完 成 x 一 g(x) 的 非 线 性 映射 ， 输 出 层 实现 从 g(x) 一 F(x) 
的 线性 映射 。 


6. 5. 3 网 络 学 习 算法 


仍 以 RBF 网 络 作为 通用 通 近 需 为 例 ， 给 出 其 对 非 线 性 函数 (系统 ) 进行 下 近 的 学 习 过 
程 。 图 6-20 为 逼近 器 结构 图 。 其 中 , 左 为 采样 时 间 ，x(&) 为 控制 信号 ， 直 接 作用 于 被 控 对 
象 ,，y(k) 为 过 程 的 实际 输出 〈 称 为 导师 信号 ) ， 两 者 共同 作为 RBF 逼近 器 的 输入 信号。 
ya( 记 为 RBF 网 络 的 实际 输出 ， 将 理想 输出 和 网 络 实际 输出 的 误差 作为 逼近 融 的 调整 信 
Se(k) 。 











本 2 [检控 对 鲁 一 























e(k) yn(h) 
xmo 、 on RBF 网 
输入 层 隐藏 层 输出 层 
图 6-19 RBF 网 络 拓扑 结构 图 图 6-20 RBF 神经 网 络 允 近 玫 





在 RBF 网 络 结构 中 ,设立 =[x, ，x,，…x,, ] 7 为 网 络 的 输入 向 量 ， 隐 藏 层 的 径 向 基 向 量 
表示 为 6=[gt, gy 如 可" 即 


| | X-C; | ] ， 
gi=exp| 一 i=1 2 


202 


了 





其 中 ,隐藏 层 第 ;个 节点 中 心 向 量 为 Cj=[e]7=[ou， ea em], j=1, 2, mm 
设 网 络 的 基 宽 向 量 为 
5S=[0,,0,,…0,]! 
其 中 ，o; 为 节点 i 的 基 宽 参数 。 网 络 的 权 值 撩 量 表示 为 
到 = [oz =[w1 ,ws，,…wi] "(k=1, 网 络 只 有 一 个 输出 节点 ) 
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则 RBF 网 络 的 实际 输出 为 
yank)= wg tw gt twig: 
调整 信号 为 理想 输出 和 网 络 实际 输出 的 误差 ， 即 
e(k)=y(k)-y,(k) 
建立 目标 函数 ， 即 误差 性 能 指标 函数 为 


J=7e (kh)?=7 0(k) -yk))? 


借助 梯度 下 降 法 、 连 锁 法 和 带 有 惯性 项 的 权 值 修正 法 ， 对 待 训练 的 各 组 参数 进行 修正 ， 
算法 如 下 : 























9 ee 
Awi= -nn eh) De 
Wi 
We 1)) 
a] Oi(k) ogi | X-C; |? 
Ao.= -nO——= . k).: . 三 . k): EE 
0 e(k) Oe e(k) * wi" gi 
oi(k+1)= oo,(k)+Ao,+ta(o,(k)-o,(k-1)) 
90/ Oyn(k) 68; Xj 
Ac..=— =n.e(k).: 。 =n.e(k) .1W0;，， 。 三 二 2 
cj= 一 7 de, 7 * el(k) i ne(k):w 3 (j=1,2,…,m) 


ci k+1)= ci(k) +Acita( cy(k) -cs k-1)) 

其 中 ，7y 为 学 习 效率 , me[0，1] ; a 为 动量 因子 , ae [0, 1]。 

在 程序 设计 中 ， 对 所 有 权 值 矢量 不、 基 宽 向 量 三 和 中 心 矢量 Ci(i=1，2，…，7) 赋 以 
随机 任意 小 值 ， 预 先 设 计 和 迭代 步 数 ， 或 给 出 网 络 训练 的 最 终 目 标 ， 如 J=10-，， 使 网 络 跳出 
递归 循环 。 


6.5.4 RBF 网 与 BP 网 的 对 比 


1) 从 结构 上 看 ， 两 者 均 属于 前 向 网 络 ，RBF 网 为 三 层 网 络 ， 即 只 有 一 个 隐藏 层 ， 而 
BP 网 的 拓扑 结构 可 以 实现 多 隐藏 层 。 

2) 在 训练 中 ，BP 网 络 主要 训练 2 组 参数 ,分别 是 输入 层 到 隐藏 层 的 权 值 向 量 以 及 隐藏 
层 到 输出 层 的 权 值 向 量 ;， 而 RBF 网 络 不 仅 需 要 训练 隐藏 层 到 输出 层 的 权 值 向 量 ， 还 要 对 基 
宽 参数 和 中 心 矢量 进行 训练 。 

3) RBF 网 的 激活 函数 多 采用 高 斯 基 汕 数 ， 其 值 在 输入 空间 的 有 限 范围 内 为 非 零 值 ， 因 
而 是 一 种 局 部 通 近 的 神经 网 络 。 相 比 BP 网 ，RBF 网 具有 学 习 收 敛 快 的 优点 ,适合 于 实时 性 
要 求 高 的 场合 。 

4) RBF 网 络 中 隐 含 层 市 点 数 比 采用 Sigmoid 型 激活 函数 的 前 向 网 络 所 用 数目 多 很 多 
这 是 由 于 RBF 网 络 只 对 输入 空间 的 较 小 范围 产生 响应 。 

5) RBF 网 络 在 功能 上 与 模糊 系统 有 一 定 的 联系 ， 与 BP 网 络 相 比 ， 其 更 适合 用 于 设计 
模糊 神经 网 络 系 统 。 

在 技术 上 ， 很 难 找到 不 同形 式 和 类 型 的 基 消 数 作用 于 同一 个 RBF 网 络 中 ， 同 时 也 很 难 
证 明 可 以 在 同一 个 RBF 网 络 中 采用 不 同类 型 的 激活 函数 。 理 论 已 经 证 明 ， 只 要 隐藏 层 选择 
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3 人 工 智 能 技术 


足够 的 神经 元 ， 一 个 RBF 网 络 可 以 以 任意 期 望 精度 通 近 任意 画 数 。RBF 网 络 良 好 的 数学 基 
础 已 使 其 在 西数 通过 、 函数 插值 、 数 值 分 析 等 领域 得 到 广泛 地 应 用 。 





6.6 CMAC 神经 网 络 


1975 he J.S. Albus 提出 小 脑 模型 控制 器 (Cerebellar Model Articulation Controller, 
CMAC) 。 它 是 仿照 小 脑 如 何 控制 肢体 运动 的 原理 而 建立 的 神经 网 络 模型 ， 其 并 不 具备 人 工 
AR 接 结构 ， 也 不 具备 动力 学 行为 ， 而 只 是 一 种 非 线 性 映射。W.T. Miller 等 
人 随后 将 6 (Delta) 算法 引入 到 CMAC 的 学 习 中 ， 利 用 其 成 功 地 实现 了 机 器 人 手臂 协调 和 运动 
控制 ， 成 为 神经 网 络 在 机 器 人 控制 中 的 一 个 经 典范 例 。 


6. 6. 1 CMAC 网 络 结构 


CMAC 是 典型 的 前 向 网 络 ， 一 个 简单 的 CMAC 模型 结构 如 图 6-21 所 示 。 


A 


CD W2 
03 ws3 yl=F(X!) 


| y=F(X?) 
































y3=F(XY) 


























图 6-21 CMAC 模型 结构 
图 中 , 表示 n 维 输 入 状态 空间 ，4 为 具有 m 个 单元 的 存储 区 (联想 记忆 空间 )。 设 
CMAC 网 络 的 输入 向 量 用 n 维 输入 状态 空间 对 中 的 点 婵 = (好 ， 双 ，… 允 ) ”表示 ， 对 应 的 输 
出 向 量 用 y?=F(x?，x9，…x? ) 表示 ， 这 里 , p=1，2，3。4 中 的 每 个 元 素 只 取 0 或 1 两 种 
值 ， 输 入 空间 的 一 个 点 关 将 同时 激活 4 中 的 C 个 元 素 (如 图 6-21，C=4)， 使 其 同时 为 1， 


而 其 他 多 数 元 素 为 0， 网 络 的 输出 y? 为 4 中 4 个 被 激活 单元 对 应 的 权 值 之 和 。C 称 为 泛 化 参 
数 ， 它 规定 了 网 络 内 部 影响 网 络 输出 的 区 域 大 小 。 


6. 6.2 网 络 学 习 算 法 


CMAC 网 络 由 输入 层 、 中 间 层 和 输出 层 组 成 。CMAC 网 络 的 设计 主要 包括 输入 空间 的 划 
分 、 输 入 层 至 输出 层 非 线性 映射 的 实现 、 输 出 层 权 值 自 适应 线性 映射 。 网 络 的 工作 过 程 由 以 
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下 两 个 基本 映射 实现 。 

(1) 概念 映射 (X 4) ”概念 映射 实质 上 就 是 输入 空间 至 概念 存储 器 4 的 映射 。 

鉴于 在 实际 应 用 中 要 实现 硬件 对 网 络 结构 的 模拟 ， 网 络 中 输入 向 量 的 各 个 分 量 均 来 自 于 
不 同 的 传 感 需 ， 其 值 一 般 为 模拟 量 ， 而 4 中 的 每 个 元 素 或 者 为 1， 或 者 为 0， 因 此 就 必须 将 
XY 量化 ， 即 使 其 成 为 输入 空间 中 的 离散 点 ， 以 实现 空间 的 点 对 4 空间 的 映射 。 

设 输入 向 量 4 个 等 级 ， 则 个 分 量 可 组 合 为 输入 状态 空间 gq” 种 可 能 
的 状态 XY, p=1,，2,，…g 一 个 状态 XY 都 要 映射 为 4 空间 存储 区 的 一 个 集合 4? ，A? 中 
的 C 个 元 素 均 为 1。 

设 输入 状态 空间 向 量 为 人头 = (x?，x?，…xb )"， 量 化 编码 为 [x?*] ， 则 映射 后 的 向 量 可 表 
示 为 














?=S([x7])= [s(x?) ,sa( 20) ,ee, scr)] (6-4) 

式 (6-4) 中 , s([x?])=1, j=1, 2，…，C。 

映射 原则 为 :在 输入 空间 相 邻 的 两 个 点 ， 在 4 空间 有 部 分 的 重 蚕 单元 被 激励 。 距 离 越 
近 ， 重 全 越 多 ; 距离 越 远 ， 重 苹 越 少 。 正 如 图 6-21 所 示 , X 空间 的 两 个 相 邻 样本 XY 各 在 
4 中 的 映射 至 和 全 出 现 了 交集 笃 m 4 ， 即 其 对 应 的 4 个 权 值 中 有 两 个 是 相同 的 ， 因 此 由 权 
值 累加 之 和 计算 的 输出 也 比较 接近 。 从 函数 映射 的 角度 看 ， 这 一 特点 可 起 到 泛 化 的 作用 。 类 
似 地 ， 距 离 较 远 的 两 个 样本 X! 各 所 映射 的 于 门 吧 为 室 ， 这 种 泛 化 不 起 作用 ， 因 此 称 为 局 
部 泛 化 。 从 分 类 角度 看 ， 不 同 输入 样本 在 4 中 产生 的 交集 起 到 了 将 相近 样本 聚 类 的 作用 。 

(2) 实际 映射 (4 一 4,) 实际 映射 是 由 概念 存储 器 4 中 的 C 个 单元 ， 用 编码 技术 映射 
至 实际 存储 器 4, 的 C 个 单元 。 图 6-22 为 4 一 4 的 映射 图 示 。 
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Cit3 Wit3 
2 -一 | itd Wit4 
图 6-22 4 一 4 映射 


由 于 4 为 具有 m 个 单元 的 存储 区 ,为 了 使 X 空 间 的 每 一 个 状态 在 4 空间 均 存 在 唯一 的 
映射 ， 即 使 4 存储 区 中 单元 的 个 数 至 少 等 于 空间 的 状态 个 数 ， 则 
m 宇 gq" 
若 将 三 维 输入 的 每 个 分 量 量化 为 10 个 等 级 ， 则 应 满足 m 宇 1000。 但 是 对 于 许多 实际 系 
统 ，g" 往往 要 大 得 多 ， 由 于 大 多 数 的 学 习 问 题 不 会 包含 所 有 可 能 的 输入 值 ， 如 在 机 器 人 控 


(165) 








3 人 工 智能 技术 


制 中 ， 不 是 每 个 可 能 的 状态 都 要 进行 学 习 ， 因 此 ， 实 际 上 并 不 需要 9" 个 存储 单元 来 存放 学 
习 的 权 值 。 通 常 ， 采 用 哈 希 编码 (Hashing-coding) 可 将 具有 gq" 个 存储 单元 的 地 址 空间 4 映 
射 到 一 个 小 得 多 的 物理 地 址 空间 4, 中 。 
通常 地 ， 采 用 哈 希 编码 技术 中 的 除 留 余数 法 实现 CMAC 的 实际 映射 。 设 杂凑 表 长 (4 存 
储 区 大 小 ) 为 严 (m 为 正 整 数 ) ， 以 元 素 值 ;(k) +i 除 以 某 数 N(N<m) 后 所 得 余数 +1 作为 
杂凑 地 址 ， 实 现实 际 映射 ， 即 
ad(i)= (s(k) +iMOD N)+l (6-5) 
式 (6-5) 中 , i=1，2,…，C，ad(i) 表示 4, 中 的 地 址 。 
网 络 的 输出 为 4, 中 C 个 单元 的 权 值 之 和 ， 表 示 为 
y=F(X)= ow jeC 
w 可 以 通过 学 习 得 到 ， 采 用 8( Dela) 学 习 规 则 调整 权 值 。 
以 单 输出 为 例 ， 设 期 望 输出 为 r(t) ， 则 误差 性 能 指标 函数 为 


-1,2 
J=36° (2) 





其 中 , e(t) =7(t) -y(t)=7(t) -2 vw GeC), 
采用 梯度 下 降 法 、 连 锁 法 和 带 有 惯性 项 的 权 值 修正 法 ， 权 值 从 代 调整 为 : 


oF oF Oy! rt)-y'(t) Oy! elt 
Aw(t)= 7 =—7 pp 小 =7 ( ) y ( ) 5 》 :二 ) 
Wy 





oy! Ow; C Ow; C 


w(t+1)= (1) +Aw ta (w(t) -w(t-1)) 
6. 6.3 CMAC 网 络 的 特点 


1) CMAC 网 络 是 具有 联想 记忆 功能 的 神经 网 络 ， 具 有 一 定 的 泛 化 能 力 ， 即 所 谓 相 近 输 
入 产生 相近 输出 ， 远 离 的 输入 产生 独立 的 输出 ; 

2) CMAC 网 络 是 基于 局 部 学 习 的 神经 网 络 ， 其 信息 存储 在 局 部 结构 上 ， 每 次 修正 的 权 
值 很 少 ， 因 此 学 习 速 度 快 ， 适 合 于 实时 控制 ; 

3) CMAC 网 络 的 每 一 个 神经 元 的 输入 /输出 是 一 种 线性 关系 ， 由 于 对 网 络 的 学 习 只 在 线 
性 映射 部 分 ， 因 此 采用 简单 的 6 (Delta) 算法 ， 即 可 完成 对 权 值 的 修正 ， 其 收敛 速度 要 明显 
优 于 BP 网 络 ， 且 不 存在 局 部 极 小 问题 。 

CMAC 网 络 已 广泛 用 于 机 器 人 控制 、 模 式 识别 、 动 态 建 模 、 信 和 号 处 理 和 自 适 应 控制 等 领域 。 

















6.7 Hopfield 神经 网 络 





1982 年 和 1984 年 ， 美 国 加 州 理 工学 院 物 理学 家 霍 普 费 尔 德 (J. 机 Hopfield) 提出 了 离 
散 型 和 连续 型 的 Hopfield 神经 网 络 。Hopfield 在 网 络 中 引入 了 “能 量 函 数 ” 的 概念 ， 采用 类 
似 Lyapunov 稳定 性 的 分 析 方 法 ,构造 了 一 种 能 量 函 数 ， 并 证 明 ， 当 满足 一 定 的 参数 条 件 时 ， 
该 函数 值 在 网 络 演化 过 程 中 不 断 降低 ， 网 络 最 后 趋 于 稳定 。 另 外 Hopfield 利用 该 网 络 成 功 地 
解决 了 TSP 问题 的 优化 计算 ， 而 且 还 采用 电子 电路 硬件 实现 了 该 神经 网 络 的 构建 。 这 是 
Hopfield 在 神经 网 络 领 域 的 三 个 突出 贡献 。 
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Hopfield 网 络 的 提出 推进 了 神经 网 络 理论 的 发 展 ， 并 开拓 了 神经 网 络 在 联想 记忆 和 优化 
计算 等 领域 应 用 的 新 途径 。 


6. 7. 1 离散 型 Hopfield 网 络 


Hopfield 是 全 互联 反馈 网 络 ， 其 拓扑 结构 如 图 6-23 所 示 。 
Hopfield 网 络 具有 单 层 结 构 ， 每 个 
神经 元 的 输出 反馈 到 其 他 神经 元 ， 影 
响 其 状态 的 变化 ， 具 有 了 动态 特性 ， 
因此 与 静态 的 BP 神经 网 络 相 区 别 ， 
Hopfield 网 络 是 一 种 动态 神经 网 络 。 另 
外 ，Hopfield 网 络 的 神经 元 无 自 反馈 ， 
这 也 是 Hopfield 网 络 的 一 个 显著 特点 。 
对 于 连续 性 的 Hopfield 网 络 ， 如 果 对 其 
神经 元 增加 了 自 反馈 ， 网 络 将 会 表现 
出 极其 复杂 的 动力 学 行为 (可 参见 混 
沌 神经 网 络 一 节 的 介绍 ) 。 

离散 型 Hopfield 网 络 的 数学 模型 表示 如 下 : 
vi(tt1)=f(u(1t) ) (6-6) 
u(t) = >» wivi( t) — 0, (6-7) 

jzi 


其 中 wv.(i) 表示 第 i 个 神经 元 i 时刻 的 输出 状态 ，wu(i) 表示 第 i 个 神经 元 ;时刻 的 内 部 
输入 状态 ，0; 表 示 神 经 元 i 的 阐 值 ，wij 为 连接 权 值 ， 可 按照 Hebb 学 习 规 则 设计 。 式 (6-7) 
求 和 中 标 出 i 短 j， 表 明 网 络 不 具有 自 反 馈 。 式 (6-6) 中 的 激励 函数 A ) 可 选择 离散 型 的 激 
励 函 数 。 

离散 型 Hopfield 网 络 有 同步 和 异步 两 种 工作 方式 。 同 步 工 作 方式 下 ， 神 经 网 络 中 所 有 神 
经 元 的 状态 更 新 闻 时 进行 。 异 步 工 作 方式 下 ， 神 经 网 络 中 神经 元 的 状态 更 新 依次 进行 ， 每 一 
时 刻 仅 有 一 个 神经 元 的 状态 获得 更 新 ， 神 经 元 的 更 新 顺序 可 以 是 随机 的 。 

离散 型 Hopfield 网 络 的 能 量 函 数 定义 为 


n n 


1 n 
E == 3 2 wviv; 十 之 名， 


CE 

































































图 6-23 ”Hopfield 网 络 结构 图 








1 

随 着 神经 元 状态 的 更 新 ， 神 经 网 络 不 断 演化 ， 如 果 从 某 一 时 刻 开 始 ， 神 经 网 络 中 的 所 有 
神经 元 的 状态 都 不 再 发 生 改 变 ， 则 称 该 神经 网 络 演化 到 稳定 状态 。 

下 面 给 出 离散 型 的 Hopfield 网 络 在 联想 记忆 中 的 应 用 实例 。 

联想 记忆 的 目的 在 于 能 够 识别 过 去 已 经 学 过 的 输入 矢量 ， 即 使 加 上 噪声 干扰 也 应 当 能 
识别 出 来 。 联 想 记 忆 神 经 网 络 具 有 信息 记忆 和 信息 联想 的 功能 ， 能 够 从 部 分 信息 或 有 适当 
变 的 信息 联想 出 相应 的 存储 在 神经 网 络 中 的 完整 的 记忆 信息 。 许 多 识别 问题 都 可 以 转化 为 
想 记 忆 问 题 加 以 解决 。 例 如 人 脸 图 像 的 识别 ， 字 符 识 别 等 都 可 以 看 作为 联想 记忆 问题 。 

联想 记忆 网 络 可 以 是 有 反馈 的 ， 也 可 以 是 没有 反馈 的 。 目 前 ， 主 要 有 三 类 互相 有 些 重 到 
的 联想 记忆 网 络 。 
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(1) 异 联想 网 络 ”这 种 网 络 将 nn 维 空 间 的 m 个 输入 矢量 x! ，x?，…，x" 映 射 到 维 空 
间 的 mm 个 输出 矢量 yy，…,，y”"， 且 使 x 一 y'。 如 果 w' 的 邻 域 x' 能 够 满足 x'-x' | ?<s， 
则 仍 有 x' 一 y'。 

(2) 自 联想 网 络 ”这 是 一 种 特殊 的 循环 联想 网 络 类 型 ， 这 种 网 络 矢量 与 自身 联想 ， 即 
y =x (i=1，2,，…,，m)， 这 类 网 络 的 功能 是 除去 输入 中 的 噪声 干扰 。 

(3) 模式 识别 网 络 ”这 也 是 一 种 特殊 的 循环 联想 网 络 类 型 ,每 一 个 矢量 x' 联 想 于 一 个 
标量 i， 这 种 网 络 的 目的 是 识别 出 输入 模式 的 “名 称 ”。 

这 三 种 联想 网 络 也 可 理解 为 网 络 能 在 给 定 输入 下 ， 产生 期 望 输出 的 自动 机 。 

从 生物 神经 元 的 机 制 所 得 到 的 训练 联想 网 络 的 学 习 算 法 称 为 Hebb 学 习 规 则 。Hebb 学 习 
规则 的 含义 是 : 两 个 同时 激励 的 神经 元 之 间 所 生成 的 互相 耦合 程度 ， 要 比 那些 互相 无 关联 的 
神经 元 之 间 的 耦合 大 得 多 。 

对 于 1M 个 不 同 的 存储 模式 x!，x?，…… ，%， 其 中 x*= (x ， ，X%)， wu=1， 
2, ee ， 导 ， 由 Hebb 学 习 规则 确定 的 Hopfield 网 络 连接 权 值 为 











M 
7 1 天 7 
we (6-8) 
0 i=j 
例如 ， 设 联想 记忆 模式 为 下 列 的 5 个 字符 ， 每 个 字符 为 10x10 的 点 阵 ， 即 每 个 模式 为 含 
有 100 个 元 素 的 向 量 ,按照 式 (6-8) 设计 100x100 的 权 值 矩阵 ， 当 添加 的 噪声 (黑色 反 转 
为 白色 ， 或 白色 反 转 为 黑色 ) 小 于 20% 时 ， 联 想 成 功率 可 达 90% 以 上 。 























































































































































































































图 6-24 联想 记忆 样本 

















6. 7.2 连续 型 Hopfield 网 络 凡 
连续 型 Hopfield 网 络 的 拓扑 结构 与 离散 型 网 络 相 。 一 和 
同 ， 且 可 采用 如 图 6-25 所 示 的 硬件 电路 模型 实现 。 “一 | Ee 
图 6-25 为 一 个 神经 元 的 硬件 电路 模型 ，v ;为 神 卫 
经 元 的 输入 状态 ，R, 和 C; 分 别 为 输入 电阻 和 输入 电 “tt 
容 , 1 为 输入 电流 ，w; 为 第 j 个 神经 元 到 第 i 个 神经 7 
元 的 连接 权 值 。w 为 神经 元 的 输出 ， 是 神经 元 输入 状 
态 的 非 线性 函数 。 SE 
根据 基 尔 霍 夫 定 律 ， 建 立 第 i 个 神经 元 的 微分 方 图 6-25 连续 性 Hopfield 神经 
程 为 网 络 神经 元 电路 模型 
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(6-9) 


式 中 , i=1, 2, …, no 
激励 函数 /(. ) 可 取 为 双 曲 函数 


f(s)=p 


一 $ 





1-e 
1+e 
式 中 ，p>0。 
连续 型 Hopfield 网 络 的 权 值 也 是 对 称 的 ， 且 无 自 反 馈 ， 即 Wi=Wii, Wii=0o 
连续 性 Hopfield 网 络 的 能 量 水 数 定义 为 
_ 1 n n n 1 vy; a n 
EF=- 2 十 2 a (v)dv 一 Zl 

当权 值 和 矩阵 是 对 称 阵 ( 即 w=;) 时 

dE ww oF di dv; ui i i 

a 这 Bo di > a Eu -一 > 8 并 
由 于 w=f(u)， 则 











df '(v».) do > 
dt 和 > " dv 加 

由 于 C;>0， 双 曲 函 数 是 单调 上 升 函 数 ， 因 此 它 的 反 函 数 广 '(w;) 也 是 单调 上 升 函数 ， 则 
可 得 到 dE/di<0， 因 此 能 量 函 数 具 有 负 的 梯度 ， 当 和 且 仪 当 dv;/di=0 时 , dE/di=0，(i=1, 
2,，…, n)。 由 此 可 见 ， 随 着 时 间 的 演化 ， 网 络 的 解 总 是 朝 着 能 量 减 小 的 方向 运动 。 网 络 
最 终 到 达 一 个 稳定 平衡 点 ， 即 能 量 孔 数 的 一 个 极 小 点 上 。 

我 国学 者 雇 晓 昕 指出 ，Hopfield 网 络 的 稳定 性 并 不 是 Lyapunov 意义 下 的 稳定 性 ， 而 是 指 
平衡 点 集 的 吸引 性 ， 并 称 之 为 Hopfield 意义 下 的 稳定 性 。 有 关 Hopfield 网 络 稳定 性 的 深入 分 
析 请 参阅 文献 [1] 中 的 相关 内 容 。 

连续 型 Hopfield 神经 网 络 的 典型 应 用 是 对 优化 计算 问题 进行 求解 。 

优化 计算 涉及 的 工程 领域 很 广 ， 问 题 种 类 与 性 质 繁 多 。 归 纳 而 言 ， 最 优化 问题 可 分 为 函 
数 优 化 问题 和 组 合 优化 问题 两 大 类 ， 很 多 实际 的 工程 问题 都 可 以 转换 为 其 中 之 一 进行 求解 。 
其 中 函数 优化 的 对 象 是 一 定 区 间 内 的 连续 变量 ， 而 组 合 优化 的 对 象 则 是 解 空 间 中 的 离散 

函数 优化 问题 通常 可 描述 为 : 令 5 为 R*" 上 的 有 界 子 集 ( 即 变量 的 定义 域 ), f: S 一 R 为 
慰 维 实 值 函数 ， 所 谓 函 数 / 在 $ 域 上 全 局 最 小 化 就 是 寻求 点 Xi, eS, 使 得 f (Xi,) 在 5S 域 
上 全 局 最 小 ， 即 VX eS: Fi)< 和 AZ)。 对 于 于 变量 的 优化 问题 ， 和 = [xi ，%y，…… ， 
2 ] 并 且 al xi bi， a x <b,, *%, a, x, 0,, 其 中 “T” 为 转 置 。 

组 合 优化 问题 通常 可 描述 为 : 令 Q=1s， 9，…，s 为 所 有 状态 构成 的 解 空间 ， 
C(s;) 为 状态 s; 对 应 的 目标 函数 值 ， 要 求 寻找 最 优 解 ;*，, 使 得 V s;e 0, C(s*) = min 
C(s;) 。 组 合 优化 往往 涉及 排序 、 分 类 、 和 筛选 等 问题 ， 它 是 运筹 学 的 一 个 重要 分 文 。 

典型 的 组 合 优化 问题 有 旅行 商 问 题 (traveling salesman problem，TSP ) 、 加 工 调度 问题 
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(scheduling problem ) ，0-1 背包 问题 (knapsack problem ) 、 装 箱 问 题 (bin packing problem ) 、 
图 着 色 问 题 (graph coloring problem) 、 聚 类 问题 (clustering problem) 等 。 

1985 年 Hopfield 利用 连续 型 Hopfield 神经 网 络 成 功 求 得 30 城市 TSP 问题 的 次 优 解 ， 从 
而 使 得 该 网 络 的 研究 得 到 学 者 们 的 重视 。 

旅行 商 问题 (TSP 问题 ) 是 数学 领域 中 车 名 问题 之 一 。 假 设 有 一 个 旅行 商人 要 拜访 mn 
个 城市 ， 每 个 城市 只 能 拜访 一 次 ， 最 后 回 到 原来 出 发 的 城市 。 求 如 何 选择 最 短路 径 。 

TSP 的 历史 很 入 ， 最 早 的 描述 是 1759 年 欧 拉 研究 的 骑士 周游 问题 ， 即 对 于 国际 象棋 棋 
盘 中 的 64 个 方 格 ， 走 访 64 个 方 格 一 次 且 仅 一 次 ， 并 且 最 终 返回 到 起 始点 。 

1962 年 我 国学 者 管 梅 古 教授 给 出 了 男 一 个 描述 方法 : 一 个 邮递 员 从 邮局 出 发 ， 到 所 辖 
街道 投 邮件 ， 最 后 返回 邮局 ， 如 果 他 必须 走 遍 所 辖 的 每 条 街道 至 少 一 次 ， 那 么 他 应 该 如 何 选 
择 投递 路 线 ， 使 所 走 的 路 程 最 短 。 这 个 描述 也 被 称 为 中 国 邮递 员 问 题 ( Chinese Postman 
Problem ，CPP ) 。 

TSP 问题 是 一 个 NP (nondeterministic polynomial ) 问题 。 对 于 nn 个 城市 的 TSP 问题 ， 可 
能 存在 的 闭合 路 径 数 为 (n-1)!/2。 为 了 求 得 最 短路 径 ， 传 统 的 求解 方式 需要 搜索 全 部 路 
径 。 随 着 城市 数量 n 的 增加 ， 计 算 量 急 剧 增 大 ,产生 所 谓 的 “组 合 爆炸 ”问题 。 表 6-5 给 出 
了 每 秒 可 进行 数 亿 次 运算 的 计算 机 搜索 TSP 问题 所 需 的 时 间 。 

表 6-5 TSP 问题 的 计算 量 



























































城市 数 /n 7 15 20 50 100 200 
加 法 数 2. 5x103 6. 5x101! 1.2x1018 1. 5x1064 Sx10557 1x10374 
搜索 时 间 2. Sx10-5 秒 1.8 小 时 350 年 5x104 年 10! 年 10358 年 








TSP 问题 的 解答 形式 有 多 种 ， 其 中 之 一 可 采用 如 表 6-6 所 示 的 方 阵 形式 (以 n=5 























为 例 ) : 
表 6-6 TSP 问题 的 解答 形式 
路 径 
城市 1 和 2 3 4 5 
A 0 1 0 0 0 
B 0 0 0 1 0 
C 1 0 0 0 0 
D 0 0 0 0 1 
E 0 0 1 0 0 
在 表 6-6 的 方 阵 中 ， A， B， Gy D ， E 表示 城市 名 称 ， 1 ， 2; 35 4， 5 表示 路 径 顺 序 。 为 


了 保证 每 个 城市 只 去 一 次 ， 方 阵 每 行 只 能 有 一 个 元 素 为 1， 其 余 为 零 。 
只 能 有 一 个 元 素 为 1， 其余 为 零 。 





经 过 一 个 城市 ， 方 阵 中 每 列 也 


为 了 在 某 一 时 刻 只 能 
为 使 每 个 城市 必须 经 过 一 


次 , 方 阵 中 1 的 个 数 总 和 必须 为 n。 对 于 所 给 方 阵 ， 其 相应 的 路 径 顺 序 为 :， C-A-E-B-D-C ， 
所 走 的 距离 为 4=de4+dap+des+dpp+dpco 

采用 Hopfield 网 络 求解 n 城市 TSP 问题 ， 网 络 应 由 nxn 个 神经 元 组 成 。 当 网 络 达 到 稳定 
状态 时 ， 各 神经 元 状态 对 应 于 方 阵 中 的 各 元 素 值 (0 或 1) 。 


由于 Hopfield 网 络 能 够 稳定 到 


函数 对 应 为 能 量 函 数 ， 从 而 设计 出 对 应 的 网 络 结构 。 
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台 已 旦 . 


用 里 


函数 的 一 个 局 部 极 小 ， 因 此 可 将 描述 TSP 问题 的 优化 
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TSP 问题 的 优化 函数 可 有 多 种 形式 ， 其 中 之 一 为 
A Bb C 
£= 7 > 2 iy 和 3 分 2 Vi + ( 之 pa n) E 
货 i jzi i % YX i 


D 
志 cy > Dd vi vy + Vi41) 


x yx i 

式 (6-10) 能 量 函 数 中 ， 第 1 项 对 应 解 和 矩阵 中 每 一 行 最 多 有 一 个 1， 第 2 项 对 应 解 矩 阵 
中 每 一 列 最 多 有 一 个 1， 第 3 项 对 应 解 和 矩阵 中 共有 n 个 1。 这 三 项 是 解 矩 阵 的 约束 项 。 只 
同时 满足 这 三 项 的 解 才 是 合法 解 。 如 果 解 矩阵 不 满足 某 项 约束 条 件 ， 则 可 增 大 该 项 的 系数 来 
增 大 该 项 的 约束 权重 。 最 后 一 项 是 问题 的 指标 项 ， 对 应 最 短 距离 。 


(6-10) 



































在 进行 优化 问题 求解 时 ， S Ewe+l =-0E/9v; 即 可 实现 问题 的 求解 。 由 于 Hopfield 


yy 
网 络 的 寻 优 机 制 是 基于 梯度 寻 优 ， 所 得 优化 结果 与 初 值 选取 密切 相关 ， 而 网 络 的 初始 值 的 先 
取 通 常 缺 少 指导 信息 ， 因 此 该 网 络 通常 仅 能 对 小 规模 的 TSP 等 优化 问题 给 出 合法 解 ， 且 寻 
优 效 率 并 不 高 。 

另外 ， 以 Hopfield 网 络 为 基础 ， 结 合 混沌 理论 可 构造 出 暂 态 混沌 神经 网 络 ， 其 寻 优 效率 
和 网 络 性 能 可 得 到 明显 改善 ， 有 关 混沌 神经 网 络 的 介绍 请 参见 第 8 章 中 的 相关 内 容 。 




















6. 8 ”Elman 神经 网 络 


Elman 神经 网 络 是 J，L，Elman 于 1990 年 针对 语音 处 理 问题 而 提出 来 的 ， 是 一 种 典型 的 
局 部 回归 网 络 。Elman 网 络 可 以 看 作 是 一 个 具有 局 部 记忆 单元 和 局 部 反馈 连接 的 递归 神经 网 
络 。 它 是 在 BP 神经 网 络 的 基本 结构 基础 
上 ,通过 引入 存储 内 部 状态 的 方式 使 其 具 
备 映 射 动态 特征 的 功能 ， 从 而 使 得 系统 具 
有 适应 时 变 特性 的 能 
6. 8. 1 Elman 神经 网 络 结构 

Elman 神经 网 络 具 有 四 层 结构 : 输入 
层 、 隐 层 、 反 馈 层 和 输出 层 ， 其 结构 如 图 


6-26 所 示 。 
反馈 层 节 点 数量 与 隐 层 节点 数量 相同 ， 
































其 输入 是 隐 层 节点 输入 的 一 步 延 迟 ， 则 网 图 6-26 Elman 神经 网 络 结构 
络 的 计算 过 程 描述 为 


x(k)=f(w x (kk)+tw ul k-1)) 
x(k)= a x(k-1)+x(k-1) 
y(k)=g(w x(k)) 
其 中 ， x(k)、x(k) 及 y(k) 分 别 为 时刻 反馈 层 、 隐 层 及 输出 层 的 输出 ，w! 、w? 和 
ww 分 别 为 反馈 层 至 隐 层 、 输 出 层 至 隐 层 以 及 隐 层 至 输出 层 的 连接 权 和 矩阵 ，u(k-1) 为 网 络 外 
部 输入 向 量 ,f 为 激励 函数 ， 选 用 Sigmoid 函数 形式 。 




















(7D 





3 人 工 智 能 技术 


6. 8.2 Elman 神经 网 络 学 习 算法 

Elman 神经 网 络 的 学 习 算法 仍然 可 以 选用 梯度 下 降 法 对 网 络 进行 训练 。 训 练 的 目标 是 通 
过 对 网 络 各 层 权 值 调节 ， 使 网 络 输出 与 期 望 输出 的 均 方 误差 达到 最 小 。 具 体 学 习 算法 可 描 
述 为 





ECD= 了 (ai(D-YCOD)rOaCD-y( 有 ) 
Aw? j=ns69() 
Aw? ,=n6hu, (有 -1) 
和 = 有 op) 
Be 
9) ， es ry 


1 J 
Owj 1 全 | 











6 = > (JJ 
| 
其 中 ，;i=1，2，…，mji j=1，2,， ,nn; 9q=1， 2，…，ri 7 、 7 加 和信 分别 是 zl 、zo 
和 xz 的 学 习 步 长 。 
Elman 神经 网 络 由 于 能 够 存储 隐 层 神经 元 的 历史 信息 ， 因 此 在 时 间 序 列 预测 分 析 、 系 统 
辨识 等 领域 有 着 独特 的 应 用 性 能 。 


6.9 模糊 神经 网 络 


以 神经 网 络 为 基础 的 神经 计算 和 以 模糊 逻辑 为 基础 的 模糊 计算 ， 都 是 建立 在 数值 计算 基 
础 上 的 ， 成 为 计算 智能 的 重要 分 支 ， 两 者 既 有 相似 的 特性 ， 又 有 各 自 适 用 的 领域 。 其 相同 点 
体现 在 : 

1) 建立 在 模糊 有 逼近 理论 上 的 “万 能 逼近 顺 ”， 能 够 对 非 数 值 型 的 非 线性 函数 进行 通 近 ; 
而 神经 网 络 的 突出 特性 也 体现 为 具有 很 好 的 逼近 非 线性 映射 能 力 。 两 者 均 为 非 线性 逼近 咒 的 
典型 代表 。 

2) 模糊 理论 不 需要 对 系统 用 精确 的 数学 模型 进行 描述 ， 仅 依靠 数学 工具 
神经 网 络 是 一 种 “黑箱 式 ” 的 学 习 ， 仅 通过 输入 /输出 的 映射 关系 ， 就 能 实现 

















进行 处 理 ; 而 
对 


一 个 动态 系 
统 的 通 近 和 估计 。 
不 同 点 在 于 : 


1) 在 推理 机 制 方面 ， 模 糊 理论 依赖 “启发 式 搜索 ”策略 ， 即 借用 领域 专家 的 经 验 ， 加 
快 推理 进程 ， 求 得 问题 最 优 解 ; 而 神经 网 络 依赖 大 量 神经 元 之 间 的 高 度 连接 ， 通 过 “并 行 
计算 ”推理 输出 。 

2) 在 获取 知识 方面 ， 模 糊 理论 依靠 专家 经 验 ， 即 模糊 的 语言 信息 ; 而 神经 网 络 则 依靠 
对 数据 样本 的 学 习 ， 即 算法 实例 训练 。 
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3) 在 学 习 机 制 方面 ， 模 糊 理论 借用 对 本 领域 专家 经 验 的 归纳 ， 通 过 模糊 关系 合成 运算 
进行 推理 ;而 神经 网 络 依靠 调节 权 值 ， 即 对 网 络 层 间 权 值 参数 进行 训练 。 

4) 在 应 用 领域 上 ， 模糊 理论 主要 用 于 控制 ， 而 神经 网 络 主 要 用 于 模式 识别 与 分 类 器。 

一 般 说 来 ， 模 糊 系统 缺乏 自学 习 能 力 ， 将 人 工 神 经 网 络 (ANN) 的 学 习 机 制 和 模糊 逻辑 
(FLN) 的 人 类 思维 和 推理 结合 起 来 ， 便 构成 了 一 类 “模糊 神经 网 络 ”。 具 体 地 ， 将 神经 网 络 的 
学 习 能 力 引 入 到 模糊 系统 中 ， 将 模糊 系统 的 模糊 化 处 理 〈 实 现 难以 确定 的 隶属 函数 ) 、 模 糊 推 
理 ( 校 正 模糊 规则 ， 驱 动 推理 过 程 )、 反 模 























we Wg V1=Hs (x) 
糊 化 计算 通过 分 布 式 的 网 络 来 表示 。 本 sg 《9 一 
图 6-27 为 用 BP 神经 网 络 实现 来 属 卫 数 “。 -ONGO “0) 
的 图 示 。 
图 中 , 成 ，) 为 非 线性 函数 ， 采 用 Sig- ee 





moid 函数 生成 。 令 人 (xz) 为 论 域 为 “小 ” 
的 隶属 函数 ，w。 和 w, 分 别 确定 Sigmoid 函数 的 中 心 和 宽度 。 则 

1 
l+exp[ -ws( Xt+w. ) ] 

修正 w. 和 ws 的 值 ， 完 成 对 隶属 函数 曲线 的 绘制 。 

按 模糊 理论 和 神经 网 络 的 结合 方式 ， 大 致 可 以 划分 为 以 下 几 种 类 型 : 

(1) 神经 元 、 模 糊 模型 ”以 模糊 控制 为 主体 ， 应 用 ANN 实现 模糊 控制 的 决策 过 程 ， 样 
本 学 习 完 成 以 后 ， 这 个 神经 网 络 ， 就 是 一 个 聪明 、 灵 活 的 模糊 控制 规则 表 。 其 本 质 还 是 模糊 
系统 ， 主 要 用 于 控制 领域 。 

(2) 模糊 、 神 经 模型 ”该 模型 以 ANN 为 主体 ， 将 输入 空间 分 割 成 不 同形 式 的 模糊 推论 
组 合 ， 对 系统 先进 行 模糊 逻辑 判断 ， 以 模糊 控制 器 的 输出 作为 ANN 的 输入 。 其 本 质 还 是 
ANN， 主 要 用 于 模式 识别 领域 。 

(3) 神经 与 模糊 模型 ”该 模型 根据 输入 量 的 不 同性 质 分 别 由 ANN 和 模糊 控制 直接 处 理 
输入 信息 ， 并 作用 于 控制 对 象 ， 二 者 有 机 结合 ， 更 能 发 挥 各 自 的 控制 特点 。 

(4) 模糊 神经 网 络 ”在 结构 上 将 模糊 技术 与 ANN 融 为 一 体 ， 构 成 模糊 神经 网 络 ， 使 该 
网 络 同 时 具备 模糊 控制 的 定性 知识 表达 和 ANN 的 自学 习 能 力 。 

由 于 RBF 网 络 在 功能 上 与 模糊 系统 有 一 
定 的 联系 ， 因 此， 选取 模糊 RBF 网 络 为 例 ， 
探讨 其 网 络 结构 和 学 习 过 程 。 


6.9.1 网 络 结构 


网 络 由 输入 层 、 模 糊 化 层 、 模 糊 推理 层 和 
输出 层 组 成 ， 如 图 6-28 所 示 。 








Ms(%)= 














~ 





_ 双 模糊 推理 层 








融合 了 模糊 理论 和 RBF 映射 结构 的 模糊 ni 
RBFNN 中 信号 传播 及 各 层 的 功能 表示 为 : 

第 一 层 : 输入 层 。 该 层 的 神经 元 (节点 ) 
直接 与 输入 量 的 各 个 分 量 连接 ， 将 输入 量 传 到 A 
模糊 化 层 。 对 每 个 神经 元 i 的 输入 /输出 表示 为 图 6-28 ”模糊 RBF 神经 网 络 结构 
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f1(i)=%; 

第 二 层 : 模糊 化 层 。 每 个 节点 代表 一 个 语言 变量 值 ， 如 ZO ( 零 ) ，PB (正大 ) 等 。 使 
用 神经 网 络 实现 隶属 函数 ， 仍 采用 Gauss 函数 激活 ， 表 示 为 

fa(ij)= exp(nep ) 
DY 
J (5;)? 

其 中 ，c; 和 6b 分别 为 Gauss 函数 的 中 心 和 基 宽 ,代表 了 第 i 个 输入 变量 第 j 个 模糊 集合 
来 属 函 数 的 均值 和 标准 差 ， 其 隶属 函数 的 Matlab 表达 式 为 gaussmf (x，[c;，b;]) ， 参 数 ci 
用 于 确定 曲线 的 中 心 。 

第 三 层 : 模糊 推理 层 。 该 层 用 于 校正 模糊 规则 ， 驱 动 推理 过 程 ， 各 个 节点 之 间 实 现 模 糊 
关系 运算 ， 利 用 各 个 模糊 节点 的 组 合 得 到 相应 的 点 火 强度 ， 表 示 每 条 规则 的 适用 度 ， 即 

f= min{ fi,1) ,fli,1) ,fli,N)| 

在 此 ,借用 “乘积 ”运算 代 蔡 “ 取 小 ”运算 ,每 个 节点 j 的 输出 为 该 节点 所 有 输入 信 
号 的 乘积 ， 表 示 为 

















A = THAG 
其 中 ,N = 交 N,， WN, 为 输入 层 中 第 个 输入 隶属 函数 的 个 数 ， 即 模糊 化 层 的 节点 数 。 
第 四 层 : 实现 A 到 记 的 线性 映射 即 去 模糊 化 运算 ， 表 示 为 
HD = WA = Beli) 有 (6-11) 
其 中 ，1 为 输出 层 节点 个 数 ， 玉 为 输出 层 季 点 与 模糊 推理 层 节点 的 连接 权 信箱 阵 。 
6. 9. 2 学 习 过 程 





























仍 以 模糊 RBF 网 络 作为 通用 逼近 器 为 例 ， 给 出 其 对 非 线性 函数 ( 系统 ) 进行 逼近 的 学 
习 过 程 ， 图 6-29 为 逼近 器 结构 图 。 wb JW 
设 网 络 结构 为 2.4-4-1，y,( = 为 模糊 RBF 网 EE 
络 的 实际 输出 ，y(4) 为 期 望 输出 。 调 整 信号 为 
e(k)=y(k) -yk)=y(h) -hh 
建立 目标 函数 ， 即 误差 性 能 指标 函数 为 m yy 
3 (30 pt) 3A) HREF 网 


借助 梯度 下 降 法 、 连 锁 法 和 带 有 惯性 项 的 权 值 
修正 法 ， 对 可 调 的 各 组 参数 进行 修正 ， 算 法 如 下 : 
由 于 输出 层 取 1 个 节点 ， 故 式 (6-11) 中 7=1。 


图 6-29 模糊 RBF 神经 网 络 允 近 


oF ok ge 
py ow(k) 7 de Oy, 0 es 


wkt+1)=w(k)+Awta(w(k)-w(k-1)) 
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oF 0y,(k) Onet? 2(xi-ci) 
Ac..=-n—=7n: 大) 。 。 nH， 大 ) 。 四 上 
‘i cy Wy Onet? Oc Wa by 
Oyn(k) yk) fs of 
其 中 ， = me >- =wfs 


Onet? ofs of net 
ci(k+1)= ci(k) +Acita( ci(k) -ci( k-1)) 
oF oy,(k) Onet? (viey)” 
Mn 瑟瑟 
bk+1)= bk)+Ab ta( bk) -bk-1) ) 

从 类 型 上 看 ， 模 糊 RBF 网 络 可 看 作 是 一 种 高 级 神经 网 络 ; 在 结构 上 看 ， 其 为 多 层 前 问 
网 络 ;， 从 网 络 训 练 过 程 上 看 ,为 有 监督 网 ， 从 学 习 算 法 来 看 ， 仍 采用 的 是 Delta 学 习 规则 ， 
同 RBF 网 络 一 样 ， 属 于 局 部 逼近 网 络 。 

模糊 神经 网 络 已 在 函数 通 近 、 导 航 系统 滤波 器 、 移 动机 器 人 避 障 控制 、 模 式 识别 等 领域 
获得 比较 广泛 地 应 用 。 


6. 10 ”其 他 类 型 的 神经 网 络 介 绍 


神经 网 络 的 研究 虽然 经 历 的 时 间 不 长 ， 但 传统 单一 特性 的 人 工 神经 网 络 的 研究 已 经 相对 
成 熟 ， 目 前 神经 网 络 的 研究 热点 逐渐 转向 为 多 种 特性 相 结合 的 复合 特性 神经 网 络 的 研究 ， 即 
以 神经 生物 学 的 实验 人 研究 结果 为 基础 ， 将 存在 于 生物 神经 系统 中 的 各 种 非 线 性 特性 与 传统 神 
经 网 络 相 结 合 ， 构 造 出 具有 一 种 或 多 种 复合 特性 的 神经 网 络 ， 一 方面 从 神经 生物 学 与 认 知 科 
学 的 角度 完善 现 有 人 工 神经 网 络 的 模型 结构 ， 男 一 方面 改善 现 有 神经 网 络 信 息 处 理 的 能 

除 前 面 介绍 的 混沌 神经 网 络 、 模 糊 神 经 网 络 之 外 ， 其 他 类 型 的 复合 神经 网 络 还 有 : 迟 灌 
神经 网 络 、 随 机 神经 网 络 、 时 滞 神 经 网 络 、 脉 冲 耦 合 神经 网 络 等 。 另 外 ， 多 种 复合 特性 的 神 
经 网 络 还 有 随机 模糊 神经 网 络 、 述 沛 混沌 神经 网 络 、 混 沌 时 灌 随 机 神经 网 络 等 。 

这 类 复合 特性 的 神经 网 络 研究 的 共同 特点 之 一 ， 就 是 尽量 充分 利用 所 结合 的 非 线 性 特性 
来 改善 神经 网 络 的 性 能 和 品质 。 大 量 的 理论 和 实验 研究 也 证 实 ， 这 些 非 线 性 特性 确实 对 改善 
神经 网 络 的 性 能 能 够 起 到 积极 的 作用 。 

1. 随机 神经 网 络 

按照 神经 生理 学 的 观点 ， 生 物 神经 元 本 质 上 是 随机 的 。 因 为 神经 网 络 重复 地 接受 相同 的 
刺激 ， 其 响应 并 不 相同 。 这 就 意味 着 随机 性 在 生物 神经 网 络 中 起 着 重要 的 作用 。 随 机 神经 网 
络 (Random neural network，RNN) 正 是 仿照 生物 神经 网 络 的 这 种 机 理 进行 设计 和 应 用 的 。 
随机 神经 网 络 一 般 有 两 种 形式 : 一 种 是 采用 随机 型 神经 元 激活 函数 ; 另 一 种 是 采用 随机 型 加 
权 连 接 ， 即 在 普通 人 工 神经 网 络 中 加 入 适当 的 随机 噪声 。 

在 随机 神经 网 络 研究 方面 有 较 大 影响 的 是 美国 佛罗里达 大 学 (UCF) 的 Erol Gelenbe 教 
授 。 他 在 1989 年 提出 了 人 们 公认 的 Gelenbe 随机 神经 网 络 (GNN)。 该 网 络 的 重要 意义 在 
于 : 仿照 实际 的 生物 神经 网 络 接收 信号 流 激活 而 传导 刺激 的 生理 机 制 来 定义 网 络 。 对 于 实际 
的 生物 细胞 来 说 ， 它 们 发 射 信号 与 否 与 自身 存在 的 电势 有 关 。 历 史上 , 著名 的 Hodgkin_ 
Huxley 方程 曾经 描述 过 这 一 行为 ， 但 没有 一 个 独立 的 数学 模型 能 够 准确 地 描述 神经 元 发 射 
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信号 这 一 特征 。Gelenbe 的 RNN 模型 填补 了 这 个 空白 。 此 后 ，Gelenbe 还 提出 了 多 种 随机 神 
经 网 络 模型 ， 为 随机 神经 网 络 的 研究 做 出 了 较 大 的 贡献 。 

2. 脉冲 耦合 神经 网 络 

从 20 世纪 90 年 代 开 始 ，Reinhard Eckhorn 等 根据 对 猫 的 视觉 皮层 神经 元 脉冲 串 同步 振 
荡 现象 的 人 研究， 得 到 了 哺乳 动物 神经 元 模型 ， 并 由 此 发 展 形成 了 脉冲 耦合 神经 网 络 模型 。 
1989 年 ，Reinhard Eckhom 在 论文 中 首次 提出 脉冲 耦合 神经 网 络 ( Pulse-Coupled Neural Net- 
work ,PCNN) ， 并 用 来 解释 在 猫 的 大 脑 皮 层 实 验 中 出 现 的 由 于 视觉 特征 刺激 而 引起 的 神经 元 
同步 兴奋 现象 。PCNN 以 其 神经 元 集团 的 接收 场 、 链 接 场 、 尖 脉冲 发 放 和 同步 建立 等 各 种 机 
制 ， 体 现 出 了 许多 普通 神经 网 络 所 不 具备 的 特性 ， 被 称 为 第 三 代 神 经 网 络 。 脉 冲 耦 合 神经 网 
络 更 加 接近 真实 哺乳 动物 视觉 神经 网 络 中 神经 细胞 的 工作 原理 ， 并 且 非 常 适 合 图 像 分 割 、 图 
像 平滑 、 降 噪 等 图 像 处 理 方面 的 应 用 。 

PCNN 的 神经 元 模型 由 “链接 部 分 ”和 “人 尖 脉 冲 发 生 器 ”两 部 分 构成 ， 如 图 6-30 所 示 。 
“链接 部 分 ”包含 了 若干 个 树 突 ， 每 个 树 突 又 含 看 干 个 与 视网膜 神经 元 轴 突 连接 的 馈送 输入 
突 触 。 各 链接 输入 信号 和 各 馈送 输入 信和 号 被 调制 耦合 形成 神经 元 的 内 部 行为 。“ 尖 脉冲 发 生 
器 ”是 以 时 间 第 数 mp 对 该 神经 元 的 输出 进行 漏电 容积 分 的 变 国 值 函 数 和 人 硬 限 幅 函数 组 成 ， 
它 通 过 对 内 部 行为 和 动态 国 值 进行 不 断 比 较 来 决定 是 否 输出 尖 脉 冲 。PCNN 的 神经 元 模型 可 
以 用 数学 表达 式 描 述 为 
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图 6-30 PCNN 的 神经 元 模型 


Fn] =e Fln-1)]+S;+ Ve SY mmYuln 三 由] (6-12) 
Liln]j =e “Ln-1]+ Vi Swim Yul n 过 中 (6-13 ) 
Uln]=FyLn]|1+BL;L nj| (6-14) 

1 UL n]>0;Ln] 
Yl")] | 0 otherwise Poo), 
Ojln]=e “Ol n-l]+VoY;Ln] (6-16) 





式 (6-12) ~ 式 (6-16) 中 8$ 为 输入 的 刺激 信号 ,下 为 输入 的 馈送 信号 , 工 为 输入 的 链 
接 信和 号,，U 为 神经 元 的 内 在 活性 函数 ，Y 为 神经 元 输出 的 脉冲 信号 ，6 为 闽 值 ，B 为 链接 的 
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强度 , 和 w 代表 接受 域 中 突 触 的 权重 ，ap、Vp、aj、WV 和 ag、W 是 分 别 对 应 于 上 和 0 
的 衰减 常数 和 电压 。i 和 j 标明 了 当前 神经 元 的 位 置 ,， 大 和 /标明 了 神经 元 (i, j) 受 其 他 神 
经 元 影响 的 范围 。 

由 于 Eckhorn 提出 的 原始 神经 元 模型 比较 复杂 ， 在 实现 的 过 程 中 存在 参数 过 多 不 易 设 定 
等 困难 ， 因 此 ,许多 学 者 提出 了 多 种 改进 的 神经 元 模型 ， 并 且 在 图 像 处 理 的 各 个 方面 得 到 了 
很 好 的 应 用 。 

3， 时 滞 神 经 网 络 

考虑 到 生物 神经 元 之 间 的 信号 传递 通常 需要 一 定 的 时 间 ， 而 且 在 人 工 神 经 网 络 中 ， 电 子 
言 号 的 有 限 传输 速度 也 能 导致 神经 网 络 中 出 现时 间 灌 后 现象 。 因 此 人 们 结合 现 有 神经 网 络 模 
型 提出 了 各 种 具有 时 涉 特 性 的 神经 网 络 模型 。 目 前 这 一 领域 的 研究 主要 集中 在 时 清 特 性 对 网 
络 稳定 性 影响 的 分 析 等 方面 。 

4. 迟滞 神经 网 络 

生物 学 实验 表明 ， 生 物 的 神经 网 络 中 存在 着 迟 涌现 象 ， 迟 清 特 性 体现 了 生物 神经 系统 的 
某 些 记 忆 行 为 和 记忆 能 力 。 据 此 ， 人 们 尝试 将 神经 网 络 的 激励 函数 改 为 具有 述 浊 响 应 的 激励 








函数 来 提高 网 络 的 性 能 。 例 如 ， 对 于 离散 型 的 单 极 性 和 双 极 性 的 二 值 激励 函数 可 改 为 如 下 
形式 : 
1 u(t+1)>a 
v(t+1)=flu(it+1)]=1 0 u(ti+1)<b 
vi(t) b<u(t+1) <a 
1 u(t+1)>a 
wa(HtD=JLua(GtD]=1 l(t) < 
v(t) b<u(t+1) <a 





激励 函数 的 形式 如 图 6-31 及 图 6-32 所 示 。 























Dih vih 
1 
+1 
b a 
b of ~ a pa 
= 
图 6-31 单 极 性 迟 汪 激 励 函 数 图 6-32“ 双 极 性 迟滞 激励 函数 


同样 ， 可 构造 出 具有 述 滞 特性 的 连续 性 的 激励 函数 ， 如 图 6-33 所 示 。 


1 





0.5r 














ll | 1 
UE -0 =5 0 10 15 


3 
图 6-33 具有 述 渍 特性 的 连续 性 的 激励 也 数 
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(1+e ee) ) -1 s(t+1) 宇 s(t) 
f(s)= 
(1+e e+0) ) -1 s(t+1)<s(t) 
理论 分 析 和 实验 都 证 明了 迟 灌 神经 网 络 在 记忆 特性 等 方面 具有 良好 的 性 能 。 
此 外 ,近年 来 以 卷 积 神经 网 络 为 代表 的 深度 学 习 方 法 得 到 了 迅速 发 展 ， 本 书 将 在 下 一 章 
中 进行 专门 介绍 。 


习题 


1. 经 典 的 机 器 学 习 方 法 有 哪些 ? 

2. 基本 神经 元 的 结构 包含 哪些 部 分 ? 试 绘制 出 基本 神经 元 模型 ， 并 写 出 数学 表达 式 。 
3. BP 神经 网 络 与 RBF 神经 网 络 各 有 那些 特点 ? 

4. 如 何 利 用 Hopfield 神经 网 络 求解 TSP 问题 ? 

5. 误差 反 向 传播 算法 有 哪些 优 缺 点 ? 
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卷 积 神经 网 络 及 TensorFlow 应 用 实践 


7.1 卷 积 神经 网 络 发 展 简介 


卷 积 神经 网 络 的 概念 最 早出 自 科学 家 20 世纪 60 年 代 时 提出 的 感受 野 。 当 时 Hubel 和 
Wiesel 在 研究 猫 脑 皮层 中 用 于 局 部 敏感 和 方向 选择 的 神经 元 时 发 现 ， 每 个 视觉 神经 元 只 会 处 
理 一 小 块 区域 的 视觉 图 像 ， 视 觉 信息 从 视网膜 传递 到 大 脑 中 是 通过 多 个 层次 的 感受 野 激发 完 
成 的 。1974 年 ，Paul Werbos 提出 采用 反 向 传播 方法 来 训练 一 般 的 人 工 神经 网 络 ， 随 后 ， 该 
算法 进一步 被 术 夫 . 辛 顿 ( Geoffrey Hinton) 和 伊 恩 . 勒 坤 (Yann LeCun) 等 人 应 用 于 训练 
具有 深度 结构 的 神经 网 络 。1980 年 ， 基 于 传统 的 感知 右 结 构 ， 深 度 学 习 创 妈 人 ， 杰 夫 :六 
顿 采 用 多 个 隐 含 层 的 深度 结构 来 代 蔡 感知 需 的 单 层 结构 ， 多 层 感 知 器 模型 是 其 中 最 具 代表 性 
的 ， 而 且 多 层 感 知 器 也 是 最 早 的 深度 学 习 网 络 模型 。1984 年 ， 日 本 学 者 福 岛 邦彦 提出 了 卷 
积 神经 网 络 的 原始 模型 一 一 神经 感知 机 (Neocognitron ) 。1998 年 ， 伊 恩 . 勒 坤 提出 了 深度 
学 习 常 用 模型 之 一 的 卷 积 神经 网 络 LeNet-5 ( Convoluted Neural Network ，CNN ) ， 采 用 基于 梯 
度 的 反 向 传播 算法 对 网 络 进 行 有 监督 的 训练 ， 经 过 训练 的 网 络 通过 交替 连接 的 卷 积 层 和 下 采 
样 层 将 原始 图 像 转 化 成 一 系列 的 特征 图 ， 最 后 通过 全 连接 的 神经 网 络 针对 图 像 的 特征 表达 进 
行 分 类 。2006 年 ， 杰 夫 … 辛 顿 提出 了 深度 学 习 的 概念 ， 随 后 与 其 团队 在 文 草 “A fast 
Learning Algorithm for Deep Belief Nets” 中 提出 了 深度 学 习 模 型 之 一 的 深度 信念 网 络 ， 并 给 出 
了 一 种 高 效 的 半 监 督 算法 ， 即 逐 层 贪心 算法 ， 并 利用 该 算法 训练 深度 信念 网 络 的 参数 ， 打 破 
了 长 期 以 来 次 度 网 络 难以 训练 的 僵局 。2009 年 ，Yoshua Bengio 提出 男 一 种 深度 学 习 的 常用 
模型 ， 即 堆 笃 自动 编码 器 (Stacked Auto-Encoder，SAE ) ， 该 模型 采用 自动 编码 器 来 代替 深 
度 信念 网 络 的 基本 单元 来 构造 深度 网 络 。2012 年 Krizhevsky 等 提出 的 AlexNet 在 大 型 图 像 数 
据 库 ImageNet 的 图 像 分 类 竞赛 中 以 准确 度 超越 第 二 名 11% 的 巨大 优势 夺 得 了 冠军 ， 使 得 卷 
积 神经 网 络 成 为 了 学 术 界 的 焦点 。 在 AlexNet 以 后 ， 新 的 卷 积 神经 网 络 模型 陆续 被 提出 ， 比 
如 牛津 大 学 的 VGG、Google 的 GoogLeNet、 微 软 的 ResNet 等 。2016 年 3 月 ， 谷 歌 AlphaGo 和 
世界 围棋 冠军 李 世 石 开展 了 世纪 人 机 大 战 ， 结 果 谷 歌 AlphaGo 战胜 了 李 世 石 ， 由 此 ， 深 度 学 
习 开 启 了 一 个 新 的 纪元 。 



































7.2 卷 积 神经 网 络 工作 原理 


最 初 的 卷 积 神经 网 络 是 为 了 解决 识别 等 问题 而 设计 的 ， 是 一 种 从 信号 处 理 衍 生 过 来 的 数 
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字 信 号 处 理 方 式 。 近 年 来 卷 积 神经 网 络 在 语言 识别 、 人 脸 识别 、 自 然 语言 处 理 、 运 动 分 析 和 
通用 物体 识别 等 方面 都 展现 出 独特 的 优势 。 

通常 ， 卷 积 神经 网 络 由 卷 积 层 、 池 化 层 和 全 连接 层 组 成 。 其 中 ， 卷 积 层 和 池 化 层 相 配合 
进行 特征 提取 ， 最 终 通 过 香干 个 全 连接 层 来 完成 分 类 。 卷 积 神经 网 络 的 主要 特点 就 是 局 部 连 
接 、 权 值 共享 和 池 化 层 中 的 降 采 样 。 在 卷 积 神经 网 络 中 局 部 连接 和 权 值 共享 技术 降低 了 参数 
的 数量 ， 使 得 训练 复杂 度 大 大 下 降 ， 并 克服 了 过 拟 合 现象 的 发 生 。 权 值 共享 赋予 了 卷 积 神经 
网 络 对 目标 平移 的 容忍 性 ， 池 化 层 采 样 会 进一步 降低 输出 参数 数量 ， 提 高 了 模型 的 泛 化 能 
力 。 与 一 般 的 神经 网 络 相 比 ， 卷 积 神经 网 络 最 大 的 优势 在 于 可 以 在 训练 过 程 中 自动 完成 特征 
的 提取 和 抽象 ， 同 时 进行 模式 分 类 ， 降 低 了 图 像 识 别 的 难度 。 

在 卷 积 神经 网 络 中 ， 第 一 个 卷 积 层 会 直接 接受 图 像 像 素 级 的 输入 ， 每 一 个 卷 积 操作 只 处 
理 一 小 块 图 像 ， 进 行 卷 积 变化 后 再 传 到 后 面 的 网 络 层 中 ， 每 一 层 卷 积 都 会 提取 数据 中 最 有 效 
的 特征 。 这 种 方法 可 以 提取 到 图 像 中 最 基本 的 特征 ， 比 如 不 同方 向 的 边 或 者 抛 角 ， 之 后 ,再 
进行 组 合 和 抽象 ， 从 而 形成 更 高 层 的 特征 ， 并 具有 对 图 像 的 缩放 、 平 移 和 旋转 的 不 变性 。 一 
般 的 卷 积 神经 网 络 由 多 个 卷 积 层 构成 ， 每 个 卷 积 层 中 包括 以 下 几 个 操作 : 

1) 图 像 经 过 多 个 不 同 的 卷 积 核 ， 提 取出 局 部 特征 ， 每 一 个 卷 积 核 都 会 重新 映射 出 一 张 
新 的 图 像 。 

2) 将 前 面 卷 积 核 的 滤波 输出 结果 ， 进 行 非 线 性 的 激活 函数 处 理 。 

3) 对 激活 函数 的 结果 再 进行 池 化 操作 。 

1，LeNet 网 络 模型 

下 面 以 典型 的 LeNet 网 络 模型 为 例 进 行 具 体 分 析 。 如 图 7-1 所 示 。 网 络 共有 8 层 结构 ， 
为 了 便于 理解 ， 这 里 对 每 一 层 进行 详细 分 析 。 
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到 7-1 ”LeNet 网 络 模型 


(1) 第 一 层 一 一 输入 层 (INPUT) ”CNN 特别 适用 于 图 像 信 息 的 处 理 。 从 图 7-1 中 可 
见 , 输入 的 是 1 张 由 32x32 像素 构成 的 矩阵 形式 的 图 像 。 需 要 说 明 的 是 ， 如 果 所 输入 岁 像 的 
尺 才 为 非 规定 的 尺寸 ， 则 需要 通过 裁剪 、 缩 放 、 插 值 等 方法 将 其 转换 为 规定 尺寸 。 

(2) 第 二 层 一 一 卷 积 层 ( Convolution) ” 卷 积 层 是 神经 网 络 的 核心 部 分 ， 主 要 的 作用 就 
是 通过 不 同 的 卷 积 核 ， 来 获取 图 像 的 信息 。 从 图 中 可 以 看 出 ， 输 入 的 是 一 张 黑白 图 片 ， 在 第 
二 层 变 成 了 28x28 的 6 张 图 片 。 这 就 意味 着 ,采用 了 6 个 不 同 的 卷 积 核 ， 对 图 像 进行 了 6 种 
不 同 特征 的 提取 。 关 于 如 何 提取 特征 ， 会 在 后 面 章 节 中 进行 介绍 ， 这 里 只 需要 了 解 卷 积 神经 
网 络 的 工作 原理 即 可 。 
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(3) 第 三 层 一 一 池 化 层 (Subsamping)” 池 化 层 也 是 神经 网 络 的 核心 部 分 ， 主 要 的 目的 
是 为 了 降 维 。 一 般 采用 的 是 最 大 值 池 化 或 者 均值 池 化 ， 这 些 池 化 方法 的 具体 操作 也 会 在 后 面 
章节 中 进行 介绍 。 从 图 中 可 以 看 到 ， 在 第 二 层 中 拥有 6 张 14x14 的 图 像 ， 也 就 是 说 ， 当 图 像 
经 过 池 化 层 以 后 ， 图 像 的 尺寸 会 缩减 一 半 ， 从 而 达到 降 维 的 目的 。 这 样 做 的 好 处 主要 有 两 
点 ， 一 方面 提高 了 系统 的 鲁 棒 性 ， 另 一 方面 也 可 在 一 定 程度 上 防止 网 络 过 拟 合 。 当 然 这 样 做 
必然 也 会 造成 部 分 信息 的 丢失 。 

(4) 第 四 层 一 一 卷 积 层 ( Convolution) ”和 第 二 层 一 样 都 是 通过 不 同 的 卷 积 核 来 提取 不 
同 的 图 像 特征 ， 和 第 二 层 不 一 样 的 地 方 在 于 卷 积 核 变 多 了 。 注 意 观察 的 话 会 发 现 ， 在 这 一 层 
中 拥有 16 张 10x10 的 图 片 ， 也 就 是 说 采用 了 16 个 不 同 的 卷 积 核 ， 提 取 了 16 种 不 同 的 图 像 
特征 。 

(5) 第 五 层 一 一 池 化 层 (Subsamping) “和 第 三 层 的 池 化 层 操作 一 样 ， 这 一 层 中 拥有 16 
张 5x5 的 图 像 。 

(6) 第 六 层 一 一 全 连接 层 (Full connection) 作用 是 把 矩阵 转换 为 一 个 向 量 ， 方 便 后 面 
网 络 进行 判定 。 

(7) 第 七 层 一 一 全 连接 层 (Full connection) ”作用 是 获得 高 维 空间 数据 的 表达 。 

(8) 第 八 层 一 一 输出 层 (OUTPUT) 输出 网 络 的 最 终结 

通过 了 解 典 型 的 LeNet 模型 之 后 ， 即 可 对 CNN 网 络 的 工作 原理 有 初步 认识 ， 接 下 来 将 
对 CNN 网 络 中 的 运算 过 程 进行 详细 介绍 。 

2. 卷 积 运算 

设 输入 图 像 为 灰 度 图 像 ， 则 可 将 灰 度 图 像 看 作 是 一 个 大 型 的 和 矩阵， 图 像 中 的 每 个 像素 可 
以 看 作 矩 阵 中 的 元 素 ， 像素 灰 度 值 的 大 小 就 是 矩阵 中 元 素 的 数值 。 在 数字 图 像 处 理 中 最 基本 
的 处 理 方法 为 线性 滤波 ， 通 常 使 用 的 滤波 工具 是 另 一 个 小 型 和 矩阵， 这 个 矩阵 称 为 卷 积 核 。 在 
介绍 卷 积 操作 前 需要 特别 强调 两 个 概念 ， 即 协 相 关 和 卷 积 的 概念 。 协 相关 是 把 卷 积 核 与 输入 
数据 对 应 相 乘 再 求 和 ， 而 卷 积 是 先 把 卷 积 核 翻转 180* ， 再 做 协 相 关 。 如 图 7-2a 所 示 为 将 所 
取 的 卷 积 核 翻转 180° 后 所 得 结果 ， 


























图 7-2b 为 利用 翻转 后 的 卷 积 核 与 ls 翻转 I80 度 | ”| > 
图 像 进行 相关 运算 所 得 结果 。 其 3 | 4 2 























中 ， 协 相关 后 左上 和 角 第 一 个 元 素 
的 计算 为 : 0x4+0x3+0x2+1x1= 
1。 本 章 中 ， 如 果 不 特别 说 明 ， 卷 
积 神经 网 络 部 分 的 卷 积 核 都 是 翻 


a) 卷 积 核 翻转 





























2 1 4 10 
转 过 后 的 卷 积 核 。 0 | 1 | 
卷 积 核 的 大 小 通常 远 小 于 图 b) 协 相关 运算 
像 矩阵 ， 进 行 卷 积 计算 的 过 程 比 图 7-2 卷 积 核 翻转 及 协 相关 运算 操作 示例 





较 简 单 ， 可 以 把 卷 积 核 想 象 成 一 

个 滑 动 窗口 ， 使 得 卷 积 核 在 图 像 矩 阵 上 按照 从 左 到 右 、 从 上 到 下 的 顺序 遍历 整个 图 像 矩阵 ， 
每 滑动 一 次 ， 就 计算 其 周围 的 像素 与 卷 积 核对 应 位 置 的 乘积 再 求 和 ， 所 得 到 的 值 作 为 新 的 像 
素 值 ， 这 样 就 完成 了 一 次 卷 积 运算 ， 如 图 7-3 所 示 为 3x3 的 卷 积 核 在 图 像 矩 阵 上 的 卷 积 运 
算 ， 可 以 表示 为 卷 积 核 与 图 像 矩 阵 相对 应 位 置 的 数 的 乘积 之 和 ， 因 此 ， 卷 积 后 所 得 矩阵 左上 
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角 的 元 素 计 算 为 : 1x1+1x0+1x1+0x0+1xl1+1x0+0x1+0x0+1xl1=4。 










































































图 7-3” 卷 积 运算 


卷 积 神经 网 络 利 用 局 部 感受 野 原理 和 权 值 共享 原理 来 降低 网 络 权 值 参数 数量 。 首 先 来 理 
解 如 何 利用 局 部 感受 野 原理 来 降低 参数 数量 。 如 图 7-4 所 示 ， 如 果 图 像 的 尺寸 是 1000x1000 
像素 ， 则 该 图 像 就 有 100 万 个 像素 点 ， 如 果 连 接 一 个 相同 大 小 的 隐 含 屋 ， 即 100 万 个 隐 含 节 
点 ， 就 将 会 有 1 万 亿 个 连接 权重 需要 去 计算 ， 从 而 所 造成 的 复杂 程度 令 人 难以 想象 。 








a) 全 连接 b) 局 部 连接 


图 7-4 全 连接 和 局 部 连接 比较 


根据 Hubel 和 Wiesel 在 研究 猫 脑 皮层 中 用 于 局 部 敏感 和 方向 选择 的 神经 元 得 出 的 感受 野 
概念 ， 图 像 在 空间 上 是 有 组 织 结构 的 ， 每 个 像素 点 在 空间 上 和 周围 的 像素 点 实际 上 是 有 紧密 
联系 的 ; 相反 ， 和 上 距离 较 远 的 像素 点 之 间 并 无 关联 。 所 以 每 一 个 神经 元 不 需要 接受 全 部 像素 
点 的 信息 ， 只 需要 接受 局 部 的 像素 点 作为 输入 。 假 设 局 部 感受 野 的 大 小 是 10x10， 即 隐 含 层 
的 每 个 节点 只 和 10x10 个 像素 点 相连 ， 那 么 对 于 1000x1000 像素 的 图 像 只 需要 10x10x100 
万 ， 即 1 亿 个 隐 含 节点 。 相 比 全 连接 的 工 万 亿 个 隐 含 节点 而 言 ， 局 部 连接 隐 含 层 节 点 数量 大 
大 减少 ， 计 算 难 度 也 因此 大 大 降低 ， 同 时 也 提升 了 网 络 的 泛 化 性 能 。 

虽然 在 上 述 过 程 中 参数 数量 大 大 降低 ， 但 是 参数 仍然 过 多 ， 还 需要 利用 权 值 共享 进一步 
降低 参数 数量 。 

如 图 7-5 所 示 ， 如 果 图 像 中 一 部 分 统计 特性 和 其 他 部 分 的 统计 特征 是 一 样 的 ,那么 也 就 
意味 着 这 部 分 学 习 的 特征 也 可 以 用 在 另 一 部 分 上 ， 这 就 是 权 值 共享 。 

一 个 卷 积 核 只 能 提取 一 种 卷 积 核 滤 波 的 结果 ， 这 就 意味 着 一 个 卷 积 核 只 提取 了 一 种 图 像 
特征 ， 所 以 在 CNN 的 一 个 卷 积 层 中 ， 通 常 需要 多 个 卷 积 核 用 于 生成 若干 个 特征 平面 (fea- 
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图 7-5 权 值 共享 原理 图 


tureMap) ， 从 而 提取 多 个 图 像 特 征 。 每 个 特征 平面 由 
一 些 矩 形 排列 的 神经 元 组 成 ， 同 一 特征 平面 的 神经 元 
共享 权 值 ， 这 里 共享 的 权 值 就 是 卷 积 核 。 如 图 7-6 所 
示 ， 图 中 含有 多 个 卷 积 核 ， 每 个 卷 积 核 都 会 生成 另 一 /RD 
张 图 像 。 ‘3 卷 积 核 1 
对 于 灰 度 图 像 ， 即 只 有 一 个 颜色 通道 的 图 像 , 卷 ” | 甩 # 
积 操作 可 采用 上 述 方式 进行 运算 。 而 对 于 彩色 图 像 ， 
即 多 通道 的 图 像 ， 其 卷 积 操作 可 按 图 7-7 所 示 进 行 


运算 。 
















卷 积 核 2 


卷 积 核 3 
设 有 一 张 彩 色 图 像 ， 即 三 种 颜色 通道 的 图 像 。 假 ”入 
设 卷 积 核 为 W， 在 进行 卷 积 操 作 时 ， 需 要 对 三 个 通道 卷 积 核 4 
的 图 像 分 别 与 卷 积 核 W 进行 卷 积 操作 ， 将 相应 位 置 的 图 7-6 多 卷 积 核 操 作 





卷 积 结果 进行 相 加 ， 青 经 过 激励 函数 获得 最 终结 果 。 
对 于 具有 多 个 卷 积 核 的 操作 也 按 此 方式 进行 。 








图 7-7 多 通道 图 像 卷 积 操作 
3. 池 化 运算 
上 面 介绍 了 如 何 利用 卷 积 操作 对 图 像 进行 特征 提取 。 在 提取 到 特征 之 后 ， 需 要 做 的 就 是 
利用 所 提取 出 来 的 特征 进行 分 类 。 一 般 的 分 类 都 是 利用 提取 到 的 特征 去 训练 分 类 器 ， 这 和 传 
统 的 神经 网 络 的 分 类 原理 一 样 ， 例 如 Softmax 分 类 器 等 。 利 用 特征 去 训练 分 类 器 的 时 候 ， 特 
征 量 比较 复杂 的 情况 下 ， 计 算 量 往往 都 是 很 大 的 。 例 如 ， 对 于 一 个 100x100 像素 的 图 像 ， 
利用 400 个 10x10 的 卷 积 核 得 到 400 个 图 像 特征 ， 根 据 之 前 所 述 可 知 ， 每 一 个 特征 和 图 像 卷 
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积 都 会 得 到 一 个 (100-10+1)x(100-10+1)= 8281 维 的 卷 积 特征 向 量 ， 这 样 ，400 个 图 像 特 
征 就 会 得 到 400x8281=3312400 维 的 卷 积 特征 回 量 ， 训 练 一 个 这 样 的 分 类 器 显然 是 很 困难 
的 。 为 了 解决 这 个 问题 ， 卷 积 神经 网 络 中 引入 了 池 化 操作 。 

在 权 值 共享 的 介绍 中 提 到 过 ， 某 个 图 像 区 域 的 特征 很 有 可 能 在 图 像 的 另 一 部 分 区 域 同 样 
适用 。 由 此 ， 可 对 图 像 不 同位 置 的 特征 进行 聚合 统计 。 例 如 ， 如 果 可 以 计算 图 像 一 个 区 域 上 
的 某 个 特定 特征 的 平均 值 或 者 最 大 值 ， 那 么 ， 这 些 概 要 统计 特征 不 仅 具 有 低 得 多 的 维度 ， 同 
时 还 会 减少 多 余 的 特征 信息 ， 从 而 改善 分 类 结果 ， 并 使 模型 不 容易 出 现 过 拟 合 现象 。 这 种 聚 
合 操作 就 是 池 化 操作 。 

池 化 也 叫做 子 采样 ， 一 般 分 为 两 种 形式 ， 一 种 是 均值 采样 ， 另 一 种 是 最 大 值 采 样 。 这 
里 ， 将 池 化 单元 称 为 过 滤器 。 均 值 采 样 的 过 滤器 中 每 个 权重 都 是 0. 5， 过 滤器 在 原 图 上 的 滑 
动 步 长 为 2， 即 每 次 移动 2 个 像素 距离 。 均 值 子 采样 相当 于 把 原 图 缩减 到 原来 的 1/4。 最 大 
值 采 样 的 过 滤器 中 权重 值 只 有 一 个 是 1， 其 他 的 权重 值 都 是 0， 过 滤器 中 为 1 的 位 置 所 对 应 
的 是 被 过 滤器 覆盖 部 分 的 最 大 值 位 置 ， 滑 动 步 长 同样 为 2， 同 样 ， 也 会 把 原 图 像 缩减 到 原来 
的 1/4。 图 7-8 给 出 了 最 大 子 采 样 的 过 程 。 


















































了 解 了 CNN 中 的 卷 积 和 池 化 运算 之 ! | ?| | 
后 , 回 过 头 来 再 看 一 下 之 前 分 析 过 的 | 3 | 4 | | | yw 6 
LeNet 模型 ， 如 图 7-1 所 示 。 结 合 卷 积 2 6 1 7 6 1 .71 
池 化 运算 来 进一步 详细 分 析 一 下 网 络 结构 | 3 | s | 6 | | 














的 运算 过 程 。 为 了 便于 理解 ， 仍 然 采 用 和 逐 
层 分 析 的 方法 。 图 7-8 池 化 操作 

第 一 层 为 输入 层 ， 输 入 层 的 原理 和 之 
前 介绍 的 一 样 ，LeNet 模型 输入 层 接收 32x32x1 的 图 像 ， 不 涉及 计算 。 

第 二 层 为 卷 积 层 ， 根 据 图 7-1， 第 一 层 的 输入 就 是 原始 图 像 ，LeNet 模型 第 一 个 卷 积 层 
的 卷 积 核 尺寸 为 5x5， 深度 为 6 ( 即 有 6 个 不 同 的 卷 积 核 ) ， 步 长 为 1 ( 即 卷 积 核 每 次 仅 移动 
一 个 像素 点 ) ， 这 样 ， 这 层 输 出 的 尺寸 为 32-5+1=28， 即 28x28 的 图 像 和 矩阵 。 这 一 卷 积 层 共 
有 5x5x1x6+6=156 个 参数 。 其 中 ，6 为 偏 置 项 参数 (与 BP 神经 网 络 里 的 阔 值 类 似 )。 对 于 
卷 积 层 来 说 ， 每 个 像素 都 与 前 一 个 输入 层 的 像素 相连 接 ， 因 此 总 共有 156x28x28 = 122304 个 
连接 。 同 理 ， 下 一 层 的 节点 和 矩阵 有 28x28x6=4704 个 节点 ， 每 个 节点 和 5x5 个 当前 层 节 点 
相连 。 

第 三 层 为 池 化 层 ， 这 一 层 的 输入 就 是 上 一 层 卷 积 层 的 输出 ， 所 以 输入 是 一 个 28x28x6 
的 节点 矩阵 。 这 一 层 采 用 的 过 滤器 大 小 为 2x2， 移 动 步 长 为 2， 所 以 这 一 层 的 输出 大 小 为 14 
x14x6， 这样， 经 过 池 化 以 后 的 图 片 尺寸 变 为 原来 的 1/2。 

第 四 层 又 为 卷 积 层 ， 与 前 一 个 卷 积 层 相似 ， 这 一 层 的 输入 为 上 一 层 的 输出 ， 即 14x14x 
6, 采用 5x5 的 卷 积 核 ， 深 度 为 16， 步 长 为 1。 这 样 ， 该 层 的 输出 尺寸 为 14-5+1=10， 深 度 
为 16， 输 出 为 10x10x16 ， 本 层 总 共有 5x5x1x16+16 =2416 个 参数 ， 拥 有 10x10x16x(25+ 
1)= 41600 个 连接 。 

第 五 层 叉 为 池 化 层 ， 与 前 一 个 池 化 层 相 似 ， 这 一 层 输入 矩阵 是 10x10x16， 所 采用 的 过 
滤器 大 小 同样 为 2x2， 移 动 步 长 为 2， 这 样 ， 该 层 输 出 为 5x5x16。 

第 六 层 全 连接 层 ， 这 一 层 的 输入 为 上 一 层 的 输出 ， 大 小 为 SxSx16。 因 为 这 一 层 的 卷 积 
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核 大 小 是 Sx5， 所 以 该 卷 积 层 可 看 作 全 连接 层 。 该 层 有 120 个 输出 节点 ,共有 5x5x16x120+ 
120=48120 个 参数 。 

第 七 层 也 为 全 连接 层 ， 这 一 层 拥 有 84 个 节点 数 ， 输 出 有 1x1x120x84+84=10164 个 
数 


Ne 


第 八 层 为 输出 层 ， 这 一 层 输 出 节点 个 数 是 10 个 ， 总 共 参 数 是 1x1x84x10+10=850 个 。 
4. 卷 积 神经 网 络 的 训练 
对 于 LeNet 这 样 的 典型 卷 积 神经 网 络 ， 其 开始 阶段 都 是 卷 积 层 和 池 化 层 的 相互 交替 使 
用 ， 之 后 采用 全 连接 层 将 卷 积 核 池 化 后 的 特征 全 部 提取 进行 概率 计算 处 理 。 在 权 值 训练 方 
面 ， 不 论 是 全 连接 层 还 是 卷 积 屋 ， 使 用 的 都 是 误差 反 向 传播 学 习 算法 。 具 体 的 训练 过 程 主要 
包括 数据 的 前 向 计算 、 误 差 的 反 向 传播 以 及 权 值 的 更 新 三 个 主要 部 分 。 简 单 地 来 看 ， 正 向 计 
算 过 程 中 所 涉及 的 权 值 和 数值 的 传递 计算 包括 : 中 输入 层 一 卷 积 层 ; @) 卷 积 层 一 池 化 层 ; 3) 
池 化 层 一 全 连接 层 ; 全 连接 层 一 输出 层 。 而 当权 重 更 新 时 ， 则 需要 对 其 进行 反 向 更 新 ， 
即 : 中 输出 层 一 全 连接 层 ; @ 全 连接 层 一 池 化 层 ; QB) 池 化 层 一 卷 积 层 ; 由 卷 积 层 一 输出 层 。 

尽管 卷 积 神经 网 络 比 前 一 章 所 介绍 的 BP 神经 网 络 结构 复杂 ， 但 其 训练 的 基本 原理 是 相 
似 的 ， 这 里 不 再 展开 介绍 。 

卷 积 神经 网 络 的 实现 方法 有 很 多 ， 特 别 是 目前 有 很 多 公司 开发 了 大 量 的 开源 框架 ， 为 卷 
积 神经 网 络 的 构建 提供 了 便利 的 平台 基础 ， 例 如 TensorFlow 就 是 其 中 运用 较为 广泛 的 开源 框 
架 之 一 。 下 面 就 对 如 何 利 用 TensorFlow 实现 卷 积 神经 网 络 的 开发 进行 简单 的 介绍 。 








7.3 TensorFlow 学 习 


7. 3. 1 TensorFlow 简介 


TensorFlow 是 由 Jeff Dean 领导 的 谷歌 大 脑 团 队 基 于 谷歌 内 部 第 一 代 深 度 学 习 系 统 
DisBelief 改进 而 来 的 通用 计算 框架 。DisBelief 是 谷歌 2011 年 开发 的 内 部 深度 学 习 工 具 ， 基 
于 DisBelief 的 ImageNet 图 像 分 类 系统 Inception 模型 赢得 了 ImageNet2014 年 的 比赛 。 利用 
DisBelief 谷歌 在 海量 的 非 标注 YouTube 视频 中 习 得 了 “ 猫 ” 的 概念 ， 并 在 谷歌 搜索 中 开创 
了 图 像 搜 索 的 功能 。TensorFlow 是 由 谷歌 公司 于 2015 年 11 月 9 日 正式 开源 的 计算 框架 。 相 
比 DisBelief，TensorFlow 的 计算 模型 更 加 通用 、 计 算 速 度 更 快 、 支 持 的 计算 平台 更 多 、 支 持 
的 深度 学 习 算 法 更 广 、 系 统 的 稳定 性 也 更 好 。 

TensorFlow 计算 框架 可 以 很 好 的 支持 深度 学 习 的 各 种 算法 ， 同 时 ，TensorFlow 还 支持 
Python、C++ 等 多 种 编程 语言 ， 而 且 它 的 应 用 也 不 局 限于 深度 学 习 ， 不过， 本 章 仪 针对 深度 
学 习 的 相关 内 容 进行 简要 介绍 。 

Python 是 一 个 高 层次 的 脚本 语言 ， 是 由 Guido van Rossum 在 20 世纪 80 年 代 末 和 90 年 
代 初 ， 在 荷兰 国家 数学 和 计算 机 科学 研究 所 设计 出 来 的 。Python 本 身 是 由 诸多 其 他 语言 发 
展 而 来 的 ， 其 中 包括 ABC、Modula-3、C、C++、 Algol-68 、SmallTalk 、Unix shell 和 其 他 的 脚 
本 语言 等 。Python 结合 了 解释 性 、 编 译 性 、 互 劲 性 和 面向 对 象 等 功能 ， 拥 有 易于 维护 、 可 移 
植 、 可 扩展 、 可 能 入 和 GUI 编程 等 特点 。 因 此 本 章 所 给 例 程 采 用 Python 语言 进行 编写 。 
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谷歌 公司 在 推广 TensorFlow 的 同时 ， 在 网 上 还 发 布 了 TensorFlow 游乐 场 网 站 ,便于 开发 
者 理解 其 工作 原理 。 因 此 ， 在 进行 理论 学 习 之 前 ， 可 先 在 TensorFlow 游乐 场 中 试 着 训练 自己 
构建 的 神经 网 络 。 下 面 对 TensorFlow 游乐 场 的 使 用 进行 简单 介绍 。 

打开 TensorFlow 游乐 场 的 网 址 (http: //playground. TensorFlow. org) ， 可 以 看 到 如 图 7-9 
所 示 的 网 络 首页 。 





Tinker With a Neural Network Right Here in Your Browser. 


Dont Worry, You Cant Break It. We Promise. 
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7-9 ”TensorFlow 游乐 场 首页 


TensorFlow 游乐 场 首页 的 左上 角 ，DATA 部 分 给 出 了 四 种 数据 分 布 ， 如 图 7- 10 所 示 ， 从 
左 到 右 依次 是 环形 数据 分 布 、 均 与 分 布 、 集 合 分 布 和 交融 分 布 。 从 每 个 子 图 中 可 以 看 到 两 种 
深浅 不 同 的 颜色 ， 分 别 代 表 两 类 数据 。 








图 7-10 数据 分 布 


在 数据 类 型 图 的 下 方 ， 有 一 些 参数 调节 的 设置 功能 ， 如 图 7-11 所 示 。data 部 分 可 以 设 
置 数据 用 于 训练 和 测试 的 比例 ，Noise 可 以 设置 添加 在 数据 集 内 的 噪声 量 ，Batch size 部 分 可 
以 设置 用 于 训练 时 每 批 次 输入 的 数据 量 的 大 小 。 
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图 7-12 给 出 了 采用 不 同 data 比例 、Noise 量 和 Batch size 参数 时 同一 个 神经 网 络 的 训练 结 
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图 7-11 参数 调 图 7-12 不 同 参数 下 同一 神经 网 络 训练 结果 


节 设 置 功能 图 


由 图 7-12 可 见 ， 即 使 同一 个 神经 网 络 也 会 因为 data 比率 、Noise 和 Batch size 的 选取 不 
同 而 得 到 不 同 的 训练 结果 。 上 述 两 种 情况 中 ， 选 取 第 一 组 参数 (data 比率 : 50% ，Noise: 
30，Batch size: 29) 时 能 够 达到 更 好 的 分 类 结果 ， 即 颜色 深浅 不 一 的 两 种 数据 能 被 更 好 地 
分 开 。 而 第 二 组 参数 (data 比率 : 70% ，Noise: 45，Batch size: 21) 时 网 络 的 训练 结果 就 
不 好 。 因 此 ， 参 数 的 设置 对 神经 网 络 的 性 能 影响 很 大 。 

在 TensorFlow 游乐 场 中 ， 可 以 自由 设计 神经 网 络 的 模型 结构 ， 即 可 以 自行 定义 隐藏 层 的 
数量 以 及 每 个 单独 隐藏 层 的 节点 个 数 ， 利 用 图 上 给 出 的 加 减 号 进行 调节 即 可 。 如 图 7-13 所 
示 ， 所 构造 的 神经 网 络 中 含有 2 个 隐藏 层 ， 第 一 个 隐藏 层 含有 4 个 节点 ， 第 二 个 隐藏 层 含 有 
6 个 节点 ， 选 择 data 比率 : 50%，Noise: 30，Batch size: 29。 从 OUTPUT 输出 部 分 可 以 看 


人 AN， 


出 ， 该 神经 网 络 拥有 较 好 的 训练 结果 ， 能 够 很 好 地 将 两 类 数据 区 分 开 。 





DATA FEATURES 3 © 2HIDDEN LAYERS OUTPUT 
Which dataset do Which properties r 1 Test loss 0.862 
you want to use? do yor want to 辣 Se 苯 Traing loss 0.865 


feed in? 


4 neurons 6 neurons 























XI | 
回民 

X2 
Ratio oftraining to 
test data: 50% 
= 一 一 一 X12 
Noise: 30 Ry 
Batch size: 29 XIX2 







-6 到 -4 瑟 二 有 00112343 6 


REGENERATE snC0 
Colors shows PE 二 
， data.neuron and T 
Sin(X2) This is the output weight values. 1 a 2 
from one neuron 
Hover to see 让 
larger 口 Show test data 图 Discretize output 


图 7-13 神经 网 络 构造 图 
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对 于 训练 好 的 神经 网 络 ， 还 可 以 查看 测试 结果 。 仔 细 看 OUTPUT 部 分 就 会 发 现 ， 在 下 
面 有 一 个 Show test data 的 选项 ， 在 框 上 点 击 一 下 ， 就 会 看 到 神经 网 络 对 应 的 测试 结果 ， 如 
图 7-14 所 示 ， 其 中 颜色 较 深 的 点 代表 测试 数据 ， 颜 色 较 浅 的 点 就 代表 训练 数据 。 

了 解 了 TensorFlow 游乐 场 之 后 ， 对 TensorFlow 就 有 了 初步 的 认识 ， 接 下 来 介绍 一 下 Ten- 
sorFlow 的 基本 内 容 。 

学 习 TensorFlow 之 前 ， 先 要 了 解 一 下 TensorFlow 的 核心 理念 。TensorFlow 中 的 计算 可 以 
表示 为 一 个 有 向 图 或 者 计算 图 ， 如 图 7-15 所 示 ， 其 中 的 每 一 个 运算 操作 可 看 作 一 个 节点 ， 
节点 与 节点 之 间 的 连接 称 为 边 。 该 计算 图 描述 了 数据 的 计算 流程 ， 计 算 图 中 的 每 一 个 节点 可 
以 有 任意 多 个 输入 和 任意 多 个 输出 ,每 个 节点 都 描述 了 一 种 运算 操作 ， 节 点 也 可 以 看 作 是 运 
算 操作 的 实例 化 。 在 计算 图 的 边 中 流动 的 数据 称 为 张 量 tensor， 在 计算 图 中 有 些 没 有 数据 流 
动 的 边 称 为 控制 依 玉 。 所 谓 的 控制 依赖 简单 理解 就 是 条 件 控 制 ， 后面 还 会 详细 说 明 。 
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图 7-14 测试 结 图 7-15 计算 图 


接 下 来 对 TensorFlow 中 的 几 个 重要 概念 进行 介绍 。 首 先 了 解 tensor 和 flow 的 含义 。 

tensor 和 flow 可 以 翻译 为 张 量 和 数据 量 。 在 TensorFlow 中 ， 从 功能 角度 来 看 ，tensor 可 
简单 理解 为 多 维 数组 。 在 程序 中 ， 所 有 的 数据 都 通过 张 量 的 形式 来 表示 。 在 TensorFlow 的 运 
算 中 ，tensor 中 并 没有 真正 保存 数字 ， 而 是 保存 如 何 得 到 这 些 数字 的 计算 过 程 ， 也 就 是 说 ， 
tensor 在 TensorFlow 中 的 实现 并 不 是 直接 采用 数组 的 形式 ， 它 只 是 对 运算 结果 的 引用 。 

以 向 量 的 加 法 为 例 ， 运 行程 序 后 ， 并 不 会 得 到 加 法 的 结果 ， 而 只 会 得 到 对 结果 的 一 个 引 
用 。 如 下 列 程序 所 示 : 


import tensorflow as tf 











a=tf. constant([1.2 2.0|], name='a') 
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b=itf. constant( [2.0, 3.0|], name='b'") 

result=tf. add(a, b, name='c') 

print( result) 

上 述 程序 代码 输出 的 最 终结 果 为 : 

Tensor("c:0", shape=(2,), dtype=float32) 

由 此 可 见 ， 所 得 到 的 不 是 一 个 具体 的 数字 ， 而 是 一 个 张 量 的 结构 ， 主 要 保存 了 name、 
shape 和 type 这 三 个 属性 ， 即 名 字 、 维 度 和 类 型 。TensorFlow 中 支持 的 张 量具 有 的 数据 属性 
如 表 7-1 所 示 。 


表 7-1 张 量 数据 属性 


















































Python 类 型 描 述 数据 类 型 
tf. float32 32 位 浮 点 型 DT_FLOAT 
tf. float64 64 位 浮 点 型 DT_DOUBLE 
tf. int64 64 位 有 符号 整 型 DT_INT64 
tf. int32 32 位 有 符号 整 型 DT_INT32 
tf. int16 16 位 有 符号 整 型 DT_INT16 
tf. int8 8 位 有 符号 整 型 DT_INTS8 
tf. uint8 8 位 无 符号 整 型 DT_UINT8 
tf. string 可 变 长 度 的 字 节 数组 ,每 一 个 张 量 元 素 都 是 一 个 字 节 数组 DT_STRING 
tf. bool 布尔 型 DT_BOOL 

tf. comlex64 由 两 个 32 位 浮 点 数组 成 的 复数 DT_COMPLEX64 
tf. qint32 用 于 量化 操作 的 32 位 有 符号 整数 DT_QINT32 
tf. qint8 用 于 量化 操作 的 8 位 有 符号 整数 DT_QINTS 
tf. quint8 用 于 量化 操作 的 8 位 无 符号 整数 DT_QUINTS 








在 TensorFlow 中 tensor 的 使 用 可 以 分 为 两 
种 情况 : 

1) 对 中 间 计 算 结果 的 引用 ， 当 一 个 计算 
过 程 包含 多 个 中 间 结 果 时 ， 使 用 张 量 可 以 在 很 
大 程度 上 提高 代码 的 可 读 性 ， 同 时 也 可 以 很 方 
便 地 获取 中 间 结 

2) 张 量 可 以 用 来 获取 计算 结果 ， 在 计算 
图 构造 完成 之 后 ， 张 量 可 以 得 到 真实 的 数字 。 
虽然 张 量 本 身 并 没有 存储 数据 ， 但 是 可 以 使 用 
Session 来 得 到 计算 结果 。Session 是 TensorFlow 
的 主要 交互 方式 。 一般 情 况 ，TensorFlow 处 理 
数据 的 顺序 就 是 建立 会 话 ， 然 后 生成 空 图 ， 青 
添加 各 个 节点 和 边 ， 最 后 形成 一 个 有 连接 点 的 
计算 图 ， 执 行 系统 计算 ， 如 图 7-16 所 示 。 

接 下 来 了 解 一 下 TensorFlow 中 另外 两 个 比 
较 重 要 的 概念 : nodes 和 edges。 

如 图 7-16 所 示 ，Nodes 也 就 是 节点 ， 指 的 
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图 7-16 ”可视化 模型 结构 图 
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是 某 个 输入 数据 在 算 子 中 的 具体 运行 和 实现 ， 算 子 就 是 集成 的 现 有 并 且 已 经 实现 的 经 典 机 器 
学 习 算法 ， 一 般 用 来 表示 施加 的 数学 运算 ， 也 可 以 表示 数据 输入 的 起 点 以 及 输出 的 终点 ， 或 
者 是 读 取 变 量 的 终点 。 常 用 的 TensorFlow 的 实现 算 子 包括 数学 运算 、 数 组 运算 、 和 矩阵 运算 、 
状态 运算 、 神 经 网 络 构建 、 队 列 和 同步 、 控 制 张 量 流动 等 。 以 数学 运算 为 例 ， 常 用 的 数学 运 
算 函 数 如 表 7-2 所 示 。 





表 7-2 常用 计算 函数 



















































































函 数 描述 
tf. add(x, y, name = None) 求 和 
tf. sub(x, y, name = None) 减法 
tf. mul(x, y, name = None) 乘法 
tf. div(x, y, name = None) 除法 
tf. mod(x, y, name = None) 取 模 
tf. ads(x, y, name= None) 求 绝 对 值 
tf. neg(x, y, name = None) 区 负 
tf. inv(x, y, name = None) 区 反 
tf. square( x, y, name = None) 计算 平方 
tf. minimum(x, y, name = None) 返回 最 小 值 
tf. maximum( x, y, name = None) 返回 最 大 值 
tf. log(x, y, name = None) 计算 log 
tf. cos(x, y, name = None) 计算 三 角 函 数 cos 


TensorFlow 的 edges 有 数据 依赖 和 控制 依赖 两 种 连接 关系 ， 一 种 是 数据 tensor 流动 的 通 
道 ， 通 常 所 说 的 张 量 即 指数 据 依 赖 。 在 机 器 学 习 算 法 中 ， 张 量 在 数据 流 图 中 从 前 往 后 流动 一 
饥 就 完成 一 次 前 向 计算 ， 残 差 从 后 往 前 流动 一 遍 就 完成 一 次 反 向 传播 。 另 一 种 是 特殊 edges ， 
用 来 控制 节点 之 间 的 依赖 关系 ， 简 单 地 说 就 是 让 数据 的 处 理 遵 循 一 定 的 顺序 进行 ， 对 于 没有 
前 后 依赖 的 数据 分 开 执 行 ， 以 便 提 高 效率 。 


7. 3.2 TensorFlow 中 的 函数 和 相关 运算 


TensorFlow 本 身 定 义 了 一 套 自 己 的 函数 ， 能 够 根据 需要 将 不 同 的 量 设置 成 所 需要 的 形 
式 。 下 面 简单 介绍 一 下 利用 TensorFlow 构建 卷 积 神经 网 络 时 经 常 使 用 的 函数 ， 并 结合 程序 代 
人 码 ， 了 人 解 各 个 函数 的 具体 用 法 。 

1. 常量 和 变量 

先 分 析 下 面 一 段 简单 的 程序 代码 。 


import tensorflow as tf 








a=tf. constant( 1) 

b=tf. constant(2, tf. int32) 
c=tf. add(a, b) 

sess=tf. Session( ) 

print( sess. run(c) ) 

上 面 程序 中 “import tensorflow as tf” 的 作用 是 导入 TensorFlow 包 ， 并 以 证 命名 。“a= 
tf. constant(1) ”是 定义 了 一 个 常量 a， 并 赋值 为 1。 “hb= 萎 Variable (2, tint32) ” 则 定义 
了 一 个 常量 ， 赋 值 为 2,“ 萎 int32” 表 示 数 据 类 型 为 32 位 整数 ， 同 理 , “tf. float” 则 表示 浮 
点 数 ,“ 芋 uint” 表 示 无 符号 整数 。“c= tf. add(a, b)” 表 示 用 加 法 运算 定义 了 一 个 变量 c， 
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“sess=tf. Session ( ) ”表示 建立 了 一 个 会 话 ， 用 于 程序 的 完整 运行 。“ print ( sess. run 
(c) ) ” 则 是 输出 “c= tf add () ”的 运算 结果 。 

常用 运算 函数 如 表 7-2 所 示 ，TensorFlow 拥有 常见 数学 运算 的 调用 函数 ， 这 里 不 在 一 一 
写 出 ， ts 让. + 函 数 名 。 

TensorFlow 提供 了 通过 变量 名 称 来 创建 或 者 获取 一 个 变量 的 机 制 ， 通 过 这 个 机 制 ， 在 不 
同 的 函数 中 a 而 不 需要 将 变量 通过 参数 的 形式 进行 传递 。 
TensorFlow 中 通过 变量 名 获取 变量 的 机 制 主要 是 通过 tf. Variable 水 数 、tf. variable. scope 因数 
以 及 tf. get。 variable 哨 数 实现 。tf. get。 variable 困 数 和 证 Variable 函数 的 主要 区 别 在 于 指定 
变量 名 称 的 参数 ， 对 于 tf. Variable 函数 来 说 变量 名 称 是 一 个 可 选 的 参数 ， 通 过 name ="v "的 
形式 给 出 ， 但 对 于 tf get_ variable 函数 来 说 变量 名 称 是 一 个 必 填 的 参数 ，tf. get_ variable 函 
数 会 根据 这 个 名 字 去 创建 或 者 获取 变量 ， 例 如 下 列 程序 所 示 : 


w=tf. get_variable("v", shape=|[1], initializer=tf. constant_initializer( 1.0) ) 























w=tf. Variable( tf. constant(1.0, shape=[1]), name="v" 
在 TensorFlow 中 提供 了 以 下 七 种 变量 初始 化 函数 : 
1) tf. constant initializer 函数 : 将 变量 初始 化 为 给 定常 量 。 主 要 参数 包括 常量 的 取 值 。 
2) 芋 random_ normal _ initializer 函数 : 将 变量 初始 化 为 满足 正 态 分 布 的 随机 数 。 主 要 
参数 包括 正 态 分 布 的 均值 和 标准 差 。 
3) tf. truncated。 normal_ initializer 图 数 : 将 变量 初始 化 为 满足 正太 分 布 的 随机 数 ， 但 如 
果 随 机 数 的 值 偏离 平均 值 2 个 标准 差 以 上 ， 那 么 这 个 数 会 被 重新 生成 。 主 要 参数 包括 正 态 分 
布 的 均值 和 标准 差 。 
4) tf.random。 uniform。 initializer 函数 : 将 变量 初始 化 为 满足 平均 分 布 的 随机 值 。 主 要 
参数 包括 最 大 值 和 最 小 值 。 
5) tf.uniform_ unit. scaling_ initializer 函数 : 将 变量 初始 化 为 满足 平均 分 布 但 不 影响 输 
出 数量 级 的 随机 值 。 
6) tf. zeros。 initializer 函数 .将 变量 设置 为 0。 
7) tf. ones。 initializer 函数 : 将 变量 设置 为 1。 
2. 矩阵 函数 
分 析 下 列 程序 : 
import tensorflow as tf 
tf. constant( [1, 2, 3], shape=[2, 3]) 
tf. random_normal(shape=[-1], mean=0.0, stddev=1.0,dtype=tf. float32, seed = None, 





name = None) 

tf. truncated_normal(shape=[-1], mean=0.0, stddev=1.0,dtype=tf. float32, seed =None, 
name = None ) 

tf. random_uniform(shape=[1, 2, 3], minval =0, maxval =None, dtype =tf. float32, seed =None, 
name = None ) 

tf. matrix_determinant (input, name =None) 

tf. matmul (a, b, transpose_a=False, transpose b=False, a is_sparse=False, b_is_sparse =False, 
name =None ) 
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上 面 的 程序 是 对 矩阵 进行 一 系列 计算 。“tf. constant ([1，2，3] ,shape= [2, 3])” 这 
行 代码 创建 了 一 个 2x3 的 矩阵 。“tf. random_ normal ( ) ”用 于 生成 正 态 分 布 的 随机 数 ， 其 
中 ，mean 为 均值 ，stddev 为 标准 差 。“t. truncated。” normal ( ) ”用 于 生成 截断 正 态 分 布 随 机 
数 ,“ 萎 random_ uniform ()” 用 于 生成 均匀 分 布 随机 数 ， “tf. matrix” determinant ( )” 用 于 
返回 方 阵 的 行列 式 , “tt. matmul ()” 用 于 实现 矩阵 相 乘 。 

3. 与 神经 网 络 有 关 的 重要 函数 

(1) 输入 数据 的 处 理 ”对 于 图 像 来 说 ， 可 以 看 作 是 一 个 像素 矩阵 ， 假 设 图 像 大 小 是 28x 
28， 也 就 是 说 图 像 有 28 x28=784 个 像素 。 在 进行 输入 的 时 候 ， 用 占 位 符 对 输入 的 数据 进行 
处 理 ， 代 码 如 下 : 

x_data=tf. placeholder("float32", [ None, 784] ) 

括号 内 分 别 表示 占 位 符 接收 float32 类 型 的 数据 ，None 表示 第 一 个 行 向 量 的 数 可 以 为 任 
意 值 ，784 表示 输入 矩阵 列 的 数量 。 

(2) 权重 和 偏 置 值 的 处 理 ” 对 于 神经 网 络 来 说 ， 权 重 和 偏 置 值 是 很 重要 的 部 分 ， 在 
TensorFlow 中 对 于 二 者 常规 的 设置 方法 是 使 用 变量 ， 这 样 有 利于 在 网 络 中 根据 需要 进行 修 
改 ， 例 如 下 面 程序 : 

weight=tf. Variable( tf. ones( [784, 10])) 
bais=tf. Variable (tf. ones(| 10|])) 

(3) 激励 函数 的 使 用 ”神经 网 络 之 所 以 能 够 解决 像 图 像 处 理 和 语音 识别 这 样 的 非 线性 
问题 ， 本 质 上 就 是 因为 激励 函数 中 加 入 了 非 线 性 的 因素 ， 从 而 提升 了 线性 模型 的 表达 能 
把 神经 元 的 特征 通过 激励 函数 保留 并 且 映 射 到 下 一 层 。TennsorFlow 中 比较 常用 的 激活 函数 
是 以 下 4 种 : 

tf. nn. relu ( ): 该 函数 是 目前 最 常用 的 激励 函数 ， 可 以 缓解 Sigmoid 函数 的 梯度 消失 问 
题 ， 有 更 快 的 收敛 速度 。 但 是 随 着 训练 的 进行 ， 部 分 输入 会 落 到 硬 饱和 区 ， 导 致 对 应 的 权重 
无 法 更 新 。 

tt nn. sigmoid ( ) : 该 函数 是 传统 神经 网 络 中 最 常用 的 激励 函数 之 一 ， 输 出 映射 在 0 和 
1 之 间 ， 单 调 连续 ， 非 常 适用 于 作 输 出 层 ， 但 具有 软 饱 和 性 ， 容 易 产生 梯度 消失 。 

tf.nn. tanh ( ): 该 函数 也 是 传统 神经 网 络 最 常用 的 激励 函数 之 一 ， 输 出 映射 在 -1 和 1 
之 间 ， 同 样 具 有 软 饱和 性 ， 但 输出 以 0 为 中 心 ， 收 敛 速度 比 Sigmoid 函数 快 。 

tf. nn. dropout ( ) : 该 激励 函数 可 令 一 个 神经 元 以 概率 的 方式 决定 是 否 被 抑制 ， 如 果 抑 
制 ， 该 神经 元 的 输出 就 会 为 0。 

(4) 损失 函数 ”损失 函数 最 常用 的 优化 方法 是 最 小 二 乘法 ， 即 通过 最 小 化 误差 的 二 次 
方 和 来 寻找 数据 的 最 佳 函数 匹配 。 利 用 最 小 二 乘法 可 以 简便 地 求 得 未 知 的 数据 ， 并 使 得 这 些 
求 得 的 数据 与 实际 数据 之 间 误 差 的 二 次 方 和 为 最 小 。 在 神经 网 络 中 最 小 二 乘法 是 计算 模型 值 
和 真实 值 之 差 的 二 次 方 和 。 例 如 ， 如 下 程序 : 

loss=tf. reduce_sum( tf. pow(y_model -y_data, 2) ) 

这 里 简单 介绍 一 下 在 神经 网 络 中 男 一 种 比较 常用 的 损失 函数 ， 即 交叉 焙 。 一 般 来 说 ， 通 过 
神经 网 络 解决 多 分 类 问题 最 常用 的 方法 就 是 设置 n 个 输出 节点 ， 其 中 为 类 别 个 数 ， 对 于 每 一 
个 样 例 ， 神 经 网 络 都 可 以 得 到 一 个 n 维 的 数组 作为 输出 结果 ， 数 组 中 每 一 个 维度 分 别 对 应 一 个 
类 别 。 在 理想 情况 下 ， 如 果 一 个 样 例 属于 某 个 类 别 ， 那么 输出 就 是 1， 否 则 输出 就 是 0。 例 如 ， 
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有 5 个 类 别 ， 设 样本 属于 第 2 类 ， 那 么 输出 结果 越 接近 [0，1，0，0，0] 就 越 好 。 
利用 交叉 简 可 以 判断 输出 向 量 和 期 望 向 量 之 间 的 差异 ， 它 可 以 刻画 出 两 个 概率 分 布 之 间 
的 距离 ， 如 果 假 设 两 个 概率 分 布 为 m 和 nn， 那 么 交叉 炉 可 以 表示 为 
H= (m,n)=- Dm(x)logn(x) 


交叉 人 刻 画 的 是 两 个 概率 分 布 之 间 的 差异 ,但 是 神经 网 络 的 输出 不 一 定 是 概率 分 布 ， 所 
以 , 一般 交叉 信 都 是 与 softmax 函数 一 起 配合 使 用 ， 在 TensorFlow 中 交叉 灼 调用 函数 是 
-tf. reduce_ mean ( ) 。 

(5) 分 类 函数 TensorFlow 中 常用 的 分 类 函数 主要 有 sigmoid_ cross_ entropy_ with_ 
logits 、Softmax 、log。 softmax 等 ， 在 这 里 介绍 一 个 分 类 因数 softmax 。 

在 Logistic regression 二 分 类 问题 中 ， 可 以 使 用 sigmoid 函数 将 输入 Wx+b 映射 到 (0，1) 
区 间 中 ， 从 而 得 到 属于 某 个 类 别 的 概率 。 也 就 是 说 ， 任 意 事件 的 概率 都 在 0 和 1 之 间 ， 且 总 
有 一 个 事件 发 生 〈 概 率 和 为 1) 。 如 果 将 分 类 问题 看 作 某 个 样 例 属于 某 种 类 别 的 概率 问题 ， 
那么 训练 样本 的 分 类 就 可 描述 为 概率 分 布 。 所 以 分 类 问题 中 ， 可 以 将 神经 网 络 前 向 计算 的 结 
果 看 作 概 率 分 布 ， 并 使 用 对 输出 的 值 归 一 化 为 概率 值 ， 其 公式 可 表示 为 


f(xi) = 2 oj + b; 
j 























ei 
Do 
y;=softmax(f(x;) )= sone 

其 中 , f(x;) 为 定义 的 训练 模型 ， 这 里 采用 的 是 输入 数据 与 权重 的 乘积 和 再 加 上 一 个 
偏 置 的 形式 ，w; 代 表 前 一 层 第 j 个 单元 与 当前 层 第 i 个 单元 之 间 的 连接 权重 ,x 代表 前 一 层 
的 第 j 个 特征 ，x; 代 表 当 前 层 的 第 i 个 特征 ，5; 代 表 当 前 层 的 第 i 个 偏 置 。softmax (f (x;)) 
的 作用 就 是 将 输入 转化 成 概率 值 。 

由 上 述 公 式 可 见 ， 原 神经 网 络 的 输出 被 用 作 置 信 度 来 生成 新 的 输出 ， 这 样 ， 新 的 输出 满 
足 概 率 分 布 的 要 求 。 这 个 新 的 输出 可 以 理解 为 经 过 神经 网 络 的 计算 ， 某 个 样本 属于 某 个 类 别 
的 概率 ， 这 样 就 把 神经 网 络 的 输出 也 转换 成 了 概率 分 布 ， 从 而 可 以 利用 交叉 焙 来 计算 预测 的 
概率 分 布 和 真实 的 概率 分 布 之 间 的 差异 。 上 述 公 式 的 程序 如 下 : 

y_model=tf. nn. softmax( tf. matmul(x_data，weight) + bais ) 

(6) 模型 的 训练 ”目前 模型 的 训练 一 般 采 用 的 都 是 梯度 下 降 方 法 ,例如 下 列 程序 : 

train_setp=tf. train. GradientDescentOptimizer( 0. 01). minimize( loss ) 

其 实 TensorFlow 中 提供 了 8 种 优化 方法 ， 即 BGCD、SGD、Momentum、 Nesterov 
Momentum、Adagrad、Adadelta、RMSprop 和 Adam。 这 里 主要 介绍 一 下 梯度 下 降 方法 。 

BGD 和 SGD 都 属于 梯度 下 降 法 ， 区 别 在 于 BGD 是 批 梯度 下 降 方 法 ， 该 方法 是 利用 现 有 
参数 对 训练 集中 的 每 一 个 输入 生成 一 个 估计 输出 ， 并 和 实际 输出 进行 比较 ， 以 统计 所 有 误 
差 ， 由 此 得 到 平均 误差 。SGD 是 随机 梯度 下 降 法 ， 该 方法 将 数据 集 拆 分 成 若干 批 次 ,采用 
随机 抽取 的 方式 进行 训练 。 

Momentum 方法 在 更 新 参数 时 在 一 定 程度 上 会 保留 之 前 的 梯度 更 新 方向 ， 利 用 当前 批 次 
微调 本 次 参数 。Nesterov Momentum 法 是 对 Momentum 方法 的 改进 。Adagrad 法 是 具有 自 适应 





softmax (f(x,;) ) = 
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学 习 率 的 优化 方法 ， 能 够 通过 自 适应 地 为 各 个 参数 分 配 不 同 的 学 习 率 来 控制 每 个 维度 的 梯度 
方向 。Adadelta 也 是 具有 上 自 适应 学 习 率 的 优化 方法 ， 它 可 看 作 是 对 Adagrad 的 改进 。 
RMSprop 和 Momentum 类 似 ， 在 实际 应 用 中 适用 于 循环 神经 网 络 。Adam 方法 根据 损失 函数 
对 各 参数 梯度 的 一 阶 矩 和 二 阶 矩 估计 来 动态 调整 各 参数 的 学 习 速 率 。 

(7) 模型 的 运行 ”模型 运行 的 程序 如 下 : 


init=tf. initialize_all_variables( ) 











sess=tf. Session( ) 
sess. run( init) 
for _ in range( 1000): 
batch_xs, batch_ys=mnist. train. next_batch( 100) 
sess. run( train_setp, feed_dict= |x_data:batch_xs, y_data:batch_ys| ) 

上 述 程 序 中 tf. initialize_ all_ variables ( ) 是 初始 化 函数 ， 而 sess. ran (init) 是 对 init 
的 运行 图 数 ，sess. run (train_ setp, feed_ dict= |x_ data: batch_ xs, y_ data: batch_ 
ys| ) 是 实现 模型 的 运行 ， 即 对 train。 step 的 运行 。 其 中 for 语句 的 作用 是 每 次 随机 取 100 
个 数据 批量 送 入 模型 中 进行 计算 ， 一共 取 10 次 。 

(8) 模型 的 准确 率 评估 TensorFlow 对 于 模型 的 评 佑 给 出 了 一 个 函数 ， 即 tf. argmax () 
函数 ， 该 函数 的 主要 作用 是 计算 张 量 在 某 一 维度 上 最 大 值 的 索引 ， 它 可 以 检测 出 模型 输出 值 
与 真实 值 是 否 相互 匹配 ,该 函数 的 使 用 例 程 如 下 : 

i _% S50 ==0: 
correct_prediction =tf. equal( tf. argmax( tf.y_model, 1), tf. argmax(y_data, 1)) 





accuracy=tf. reduce_mean( tf. cast( correct_prediction, "float ") ) 
print ( sess. run (accuracy, feed _ dict = | x _ data: mnist. test. images, y _ data: 
mnist. test. labels| ) ) 
程序 中 许 equal ( ) 函数 返回 一 系列 的 布尔 值 ， 为 了 更 好 地 对 这 些 布尔 值 进 行 描述 ， 先 利 
用 tf.cast ( ) 函数 把 这 些 布尔 值 转化 为 浮 点 值 ， 再 利用 证 reduce_ mean ( ) 求 取 平 均值 。 


7.3.3 卷 积 函数 


卷 积 函数 是 构建 卷 积 神经 网 络 的 重要 组 成 ， 先 看 一 下 conv2d () 卷 积 函数 在 TensorFlow 
中 的 用 法 ， 例 程 如 下 : 

tf. nn. conv2d( input, filter, strides, padding, use_cudnn_on_gpu, name) 

该 函数 是 TensorFlow 的 卷 积 函数 之 一 ， 它 包含 了 6 个 重要 参数 . 

(1) input 参数 ”该 参数 是 需要 做 卷 积 的 输入 图 像 ， 它 要 求 是 一 个 tensor， 也 就 是 一 个 
张 量 ， 这 个 张 量 的 形式 为 

[batch, in_ height, in_ width, in_ channels ] 。 

简单 地 说 ，input 这 个 参数 中 batch 表示 的 是 训练 的 图 像 数量 ，in_ heigh 表示 输入 图 像 
的 高 度 ，in_ width 表示 输入 图 像 的 宽度 ，i channels 表示 图 像 的 通道 数 。 例 如 ，[1, 2，2， 
1] 就 表示 一 个 2x2 的 单 通道 图 像 。 

(2) filter 参数 ”该 参数 用 于 设置 卷 积 核 参 数 ， 其 张 量 形式 为 

| filter_ height, filter width, in_ channels, out. channels ] 

其 中 ，filter _ height 表示 卷 积 核 的 高 度 ，filter ”width 表示 卷 积 核 的 宽度 ，in_ channels 
表示 卷 积 核 的 通道 数 ，out。 channels 表示 卷 积 核 的 数量 。 
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(3) strides 参数 ”该 参数 代表 卷 积 核 移 动 的 步 长 ， 例 如，[1，2，2,，1] 就 是 水 平方 向 
步 长 为 2， 竖 直方 向 步 长 也 为 2。 

(4) padding 参数 ”该 参数 表示 边界 的 处 理 方式 ， 其 类 型 为 string， 取 值 朋 “SAME” 和 
“VILAD” 两 种 ,“SAME” 表 示 采 用 补 全 方式 ,“VILAD” 表 示 采 用 丢弃 方式 。 

(5) use_cudnn_ on_ gpu 参数 ”该 参数 表示 是 否 使 用 gpu 进行 计算 ， 一 般 默 认为 使 用 状态 。 

(6) name 参数 ”一般 name=None， 表 示 行 向 量 的 数 可 以 是 任意 的 ， 即 行 向 量 的 维度 不 确定 。 

TensorFlow 提供 了 多 种 卷 积 末 数 ， 可 以 满足 不 同 卷 积 运算 的 要 求 ， 例 如 ， 
tf. nn. convolution ( ) 卷 积 函数 可 以 计算 w 维 卷 积 的 和 ，tf. nn. separable conv2d ( ) 卷 积 
函数 可 以 利用 几 个 分 离 的 卷 积 核 做 卷 积 ，tf. nn. conv2d_ transpose ( ) 卷 积 也 数 是 对 conv2d ( ) 
进行 转 置 操作 。 

为 了 能 够 直观 地 了 解 卷 积 的 作用 ， 这 里 给 出 一 个 利用 tf nn. conv2d ( ) 卷 积 函 数 对 图 
像 进 行 特征 提取 的 例子 ， 程 序 如 下 : 


import tensorflow as tf 








import cv2 

import numpy as np 

img=cv2. imread ("1. jpg ") 

img=np. array( img, dtype =np. float32) 

x_image=tf. reshape(img, [1, 482, 500, 3]) 

filter =tf. Variable (tf. ones([6, 6,3,1|)) 

init=tf. global_variables_initializer( ) 

with tf. Session( ) as sess: 
sess. run( init ) 
res=tf. nn. conv2d (x_image, filter, strides=[1, 2, 2, 1], padding='SAME ') 
res_image =sess. run(tf. reshape(res, [241, 250]))/128 +1 
cv2. imshow ("test", res_image. astype(' uint16 ') ) 
cv2. waitKey( ) 

图 7-17 为 采用 不 同 卷 积 核 进行 计算 的 输出 结果 ， 从 图 中 可 见 ， 使 用 了 7x7 的 卷 积 核 所 
生成 的 图 片 具 有 一 定 的 边缘 特征 ， 而 使 用 15x15 的 卷 积 核 后 ， 图 像 的 区 域 特征 则 非常 明显 。 











b) 7X7 卷 积 核 效果 c) 15X15 卷 积 核 效 果 
图 7-17 卷 积 效果 
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7.3.4 池 化 函数 


池 化 函数 是 TensorFlow 作为 池 化 计算 的 函数 之 一 ， 也 是 搭建 卷 积 神经 网 络 最 核心 的 函数 

之 一 。 先 来 看 一 下 该 函数 在 TensorFlow 中 的 用 法 ， 程 序 如 下 : 
tf. nn. max_pool( value, ksize, strides, padding, name) 

从 上 述 程序 可 见 ， 该 函数 包含 了 5 个 重要 参数 : 

(1) value 参数 ”该 参数 表示 池 化 层 的 输入 ， 该 参数 的 张 量 形式 为 : [batch ，height， 
width ，channels | 。 

(2) ksize 参数 ”该 参数 表示 池 化 窗口 的 大 小 ,一般 为 [1, height, width, 1] 的 形式 。 

(3) strides 参数 ”该 参数 为 池 化 的 步 长 ,一 般 为 [1， height, width, 1] 的 形式 。 

(4) padding 参数 ”该 参数 同样 是 string 类 型 ， 取 值 有 “SAME” 和 “VILAD” 两 种 。 

(5) name 参数 ”一般 name= None， 表 示 行 向 量 的 数 可 以 是 任意 的 ， 即 行 向 量 的 维 
度 不 确定 。 

在 卷 积 神经 网 络 中 ， 池 化 函数 一 般 位 于 卷 积 函数 的 下 一 层 中 ， 在 TensorFlow 中 也 提供 了 
不 同 的 池 化 函数 来 满足 不 同 池 化 操作 的 需求 ， 上 面 程序 中 的 池 化 函数 为 最 大 值 池 化 函数 ， 用 
来 计算 池 化 区 域 中 元 素 的 最 大 值 。tf. nn. avg。 pool ( ) 池 化 函数 计算 池 化 区 域 中 元 素 的 平 
均值 ，tf. nn. max_ pool_ with_ argmax ( ) 子 数 计算 池 化 区 域 中 元 素 的 最 大 值 和 该 最 大 值 的 
所 在 位 置 ，tf. nn. pool ( ) 函数 执行 一 个 NN 维 的 池 化 操作 ，tf. nn. avg_ pool3d ( ) 函数 计算 
三 维 下 的 平均 池 化 。 

为 了 能 够 直观 地 了 解 池 化 的 作用 ， 对 上 述 进行 了 7x7 卷 积 核 处 理 后 的 图 像 再 进行 最 大 
池 化 操作 。 程 序 如 下 : 


import tensorflow as tf 


























import cv2 

Import numpy as np 

img=cv2. imread("1.jpg") 

img=np. array( img, dtype =np. float32 ) 

x_image=tf. reshape(img, [1, 482, 500, 3]) 

filter=tf. Variable(tf. ones([6, 6,3, 1])) 

init =tf. global_variables_initializer( ) 

with tf. Session( ) as sess: 
sess. run( init ) 
res=tf. nn. conv2d (x_image, filter, strides=[1, 2, 2, 1], padding=' SAME ') 
res=tf. nn. max_pool(res, [1, 2, 2, 1], |1,2,2,1], padding=' VALID') 
res_image =sess. run(tf. reshape( res, [120, 125]))/128 + 1 
cv2. imshow( "test", res_image. astype(' uint8 ') ) 
cv2. waitKey( ) 

图 7-18 是 池 化 效果 图 ， 从 图 中 可 见 ， 经 过 池 化 后 的 图 像 尺寸 缩小 了 。 
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b)7X7 卷 积 核 效果 c) 最 大 池 化 效果 
图 7-18 池 化 效果 


7.4 利用 TensorFlow 进行 图 像 处 理 


卷 积 神经 网 络 的 应 用 离 不 开 图 像 处 理 操作 ， 例 如 图 像 的 读 取 、 缩 放 、 拉 伸 、 灰 度 变 化 、 
几何 校正 等 处 理 操 作 。TensorFlow 中 关于 图 像 处 理 的 部 分 可 借助 OpenCV 实现 。OpenCV 是 
Intel 公司 开发 的 用 于 计算 机 视觉 处 理 的 开源 软件 库 ， 采 用 C 语言 和 C++ 语言 编写 ， 同 时 也 
提供 了 Python 和 Matlab 等 语言 接口 ， 通 过 合理 的 使 用 和 搭配 ，OpenCV 可 以 构建 一 个 简单 易 
用 的 计算 机 视觉 处 理 框 架 ， 实现 计 算 机 视觉 的 相关 应 用 开发 。OpenCV 中 包含 了 许多 常用 的 
机 器 视觉 处 理 函 数 和 方法 ， 在 医学 影像 、 外 观 设计 、 定 位 标记 等 很 多 领域 都 有 广泛 的 应 用 。 
下 面 结合 OpenCV 对 TensorFlow 的 图 像 处 理 方法 进行 介绍 。 


7.4. 1 图 像 的 读 取 与 存储 
OpenCV 可 以 读 取 多 种 类 型 的 图 像 数据 ， 支 持 常 用 的 图 像 格式 。 例 如 下 面 的 程序 ; 


import tensorflow as tf 





import cv2 
img=cv2. imread(" 1. jpg" cv2.IMREAD_GRAYSCALE) 
cv2. imwrite("test. jpg ", img) 
上 面 程序 中 ， 利 用 imread 函数 以 灰 度 图 像 的 方式 从 当前 目录 下 读 和 人 名 为 “1. jpg” 的 图 
像 ， 然 后 利用 imwrite 函数 将 读 取 到 的 图 像 以 文件 名 “test jpg” 存 储 到 当前 目录 下 。 可 见 ， 
在 图 像 存 储 时 ， 可 根据 需要 改变 图 片 的 存储 类 型 。 


7. 4.2 图 像 处 理 常用 函数 


大 量 的 数据 样本 是 TensorFlow 进行 图 像 识 别 的 基础 ， 图 像 的 缩放 和 裁剪 等 操作 可 用 于 生 
成 大 量 的 图 像样 本 ，TensorFlow 中 定义 了 相关 的 函数 。 
(1) resize ( ) 函数 ”该 函数 常用 于 对 图 像 进 行 缩放 操作 ， 使 用 例 程 如 下 : 
import tensorflow as tf 


import cv2 
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dst=cv2. imread(" 1. jpg ") 
img= cv2. resize( dst, (150, 250)) 
cv2. imshow("test. jpg ", img) 
cv2. waitKey( ) 
利用 resize 函数 可 以 对 图 像 按 指定 尺寸 进行 缩小 或 者 放大 ， 例 如， 上 述 程 序 中 读 人 图 像 
“1. jpg”， 然 后 利用 resize 函数 将 原 图 像 转化 为 150x250 像素 大 小 的 图 像 。 例 如 ， 原 图 的 尺 
才 大 小 为 250x250， 执 行 上 述 程序 后 ， 运 行 结果 如 图 7-19 所 示 。 





pd C- 
Yt _ 
a) 原 图 
图 7-19 ”resize 函数 的 处 理 结果 








(2) getRotationMatrix2D ( ) 函数 该 函数 可 以 对 图 像 进行 旋转 操作 ， 使 用 例 程 如 下 : 
import cv2 
dst=cv2. imread("1. jpg ") 
rows, cols, depth=dst. shape 
dst_change = cv2. getRotationMatrix2D( (cols/2, rows/2) ,45, 1) 
res=cv2. warpAffine( dst, dst_change, (rows, cols)) 
cv2. imshow( "test. jpg ", res) 
cv2. waitKey( 0) 
上 述 程序 中 ,getRotationMatrix2D ( ) 中 的 参数 表示 以 图 像 的 中 心 为 原点 ， 对 图 像 按 逆 时 
针 方向 旋转 了 45"，warpAffne ( ) 函数 对 图 像 重 新 进行 了 压缩 ， 程 序 执行 结果 如 图 7-20 所 示 。 





b) 运行 结果 


图 像 旋 转 操 作 的 结果 
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利用 上 述 旋转 操作 可 生成 大 量 的 数据 样本 ， 实 现 对 数据 库 的 扩充 ， 从 而 能 够 对 卷 积 神经 
网 络 进 行 充分 的 训练 。 

(3) resize image_ with_ crop_ or pad ( ) 也 数 该 函数 用 于 调整 图 像 尺 寸 的 大 小 ， 
使 用 例 程 如 下 : 


import tensorflow as tf 





import cv2 
img=cv2. imread('4. jpeg ') 
with tf. Session( ) as sess: 


nn_image=tf. image. resize_image_with_crop_or_pad(img, 200, 200) 





nn_imagel =tf. image. resize_image_with_crop_or_pad(img, 600, 600) 





nn_image=sess. run( nn_image) 

nn_imagel =sess. run( nn_imagel ) 

cv2. imshow(' test', nn_image) 

cv2. imshow('testl ', nn_imagel ) 

cv2. waitKey( ) 

resize image_ with_ crop or pad ( ) 函数 的 第 一 个 参数 是 待 处 理 的 图 像 名 称 ， 后 两 

个 参数 是 定义 的 目标 图 像 尺 寸 。 如 果 待 处 理 图 像 的 尺寸 大 于 目标 图 像 ， 该 函数 会 自动 截取 原 
图 像 居 中 部 分 作为 目标 图 像 ， 如 果 待 处 理 图 像 的 尺寸 小 于 目标 图 像 ， 该 函数 会 自动 在 原 图 像 
的 四 周 进行 填充 。 上 述 例 程 执行 效果 如 图 7-21 所 示 。 








a) 原 图 像 b) 截取 图 像 结 果 9) 填充 图 像 结 果 





图 7-21 resize _ image with crop or pad 函数 对 图 像 进行 尺寸 调整 结果 图 





(4) tf.image. fip_ up down ( ) 限 数 和 tf.image. flip left right ( ) 函数 这 两 个 也 
数 可 实现 对 图 像 的 翻转 操作 ， 使 用例 程 如 下 : 
import tensorflow as tf 
import cv2 
img=cv2. imread('4. jpeg ') 
with tf. Session( ) as sess : 


nn_image=tf. image. flip_up_down( img) 
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nn_imagel =tf. image. flip_left_right( img) 
nn_image=sess. run( nn_image) 
nn_imagel =sess. run( nn_imagel) 
nn_image=np. uint8( nn_image ) 
cv2. imshow( 'test', nn_image) 
cv2. imshow( 'testl ', nn_imagel ) 
cv2. waitKey( ) 
fimage. flip up down ( ) 函数 可 实现 图 像 的 上 下 翻转 ， 而 芋 image. flip_ left_ right 
( ) 函数 可 以 实现 图 像 的 左右 翻转 ， 上 述 程序 执行 结果 如 图 7-22 所 示 。 


ER 5 





Ss WR 
a) 原 图 b) 上 下 翻转 c) 左右 翻转 


7-22 翻转 结果 图 





此 外 ， 还 有 沿 对 角 线 翻转 的 函数 证 image. 人 ptranspose_ right ( ) ， 使 用 方法 与 上 述 函 
数 相 似 。 
(5) evtColor ( ) 函数 该 函数 可 实现 图 像 色 彩 和 亮度 的 调节 ， 在 OpenCV 中 ， 对 图 像 
色彩 的 处 理 可 在 HSV 模型 中 进行 ， 该 函数 的 使 用 例 程 如 下 : 
import cv2 
dst=cv2. imread("1. jpg ") 
img_hsv= cv2. cvtColor( dst, cv2. COLOR_BCR2HSYV ) 
color_hsv=img_hsv. copy( ) 
color_hsv[ : ,:,0]=color_ hsv| :,:,0]*0.01 
image = cv2. cvtColor( color_hsv,cv2. COLOR_HSV2BCR ) 
cv2. imshow( "test. jpg "，image ) 
cv2. waitKey(0) 
上 述 程序 中 ，color _ hsv [:,:，0] 方 括号 中 的 第 一 个 和 第 二 个 参数 代表 图 像 矩 阵 的 坐 
标 ， 第 三 个 参数 代表 HSV 的 通道 选择 ，0 代表 色调 ，! 代表 饱和 度 ，2 代表 明亮 度 。 在 上 面 
的 程序 中 ,选择 了 对 色调 的 调节 ， 程 序 执行 结果 如 图 7-23 所 示 。 
此 外 ，OpenCV 中 还 有 用 于 图 像 去 噪 处 理 、 图 像 边缘 裁剪 等 操作 的 相关 函数 ， 使 用 方法 
可 查阅 相关 手册 。 
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a) 原 图 





图 7-23 色调 调整 结果 图 


7.5 卷 积 神经 网 络 在 MNIST 的 应 用 实例 


学 习 了 卷 积 神经 网 络 相关 知识 后 ， 接 下 来 介绍 一 个 完整 卷 积 神经 网 络 的 应 用 实例 。 这 
里 ， 以 典型 的 MNIST 手写 体 识别 为 例 构 建 一 个 简单 的 卷 积 神经 网 络 。 

MNIST 是 一 个 手写 体 数据 库 ， 它 有 60000 
个 训练 样本 集 和 10000 个 测试 样本 集 ， 如 果 打 
开 数据 库 查 看 ， 就 可 看 到 如 图 7-24 所 示 的 样 
本 集 。 

MNIST 数据 集 包 含 以 下 4 个 文件 : 

(1) train-labels-idxl-ubyte. gz 该 文件 是 
训练 集 标记 文件 ， 含 有 28881 个 字 节 。 

(2) train-images-idx3-ubyte. gz 该 文件 是 
训练 集 图 像 文件 ， 含 有 9912422 个 字 节 。 

(3) tl0k-labels-idxl-ubyte. gz ”该 文件 是 
测试 集 标记 文件 ， 含 有 4542 个 字 节 。 | 7-2 

(4) tl0k-images-idx3-ubyte. gz ”该 文件 是 
测试 集 图 像 文件 ， 含 有 1648877 个 字 节 。 

MNIST 的 训练 集 标签 文件 结构 和 图 像 文 件 结构 如 图 7-25 所 示 。 

从 图 7-25 中 可 见 ， 训 练 集 图 像 文件 中 含有 60000 个 样本 ， 训 练 集 标记 文件 中 含有 相对 
应 的 60000 个 标记 ， 每 一 个 标记 值 都 是 0~9 之 间 的 数 。 文 件 里 的 数 都 采用 二 进 制 数 进行 存 
储 ， 读 取 的 时 候 要 以 “rb” 的 方式 进行 读 取 。 

[value] 项 是 数据 项 ，[type] 描述 的 是 数据 类 型 。 根 据 [offset] 可 知 ，pixel 是 从 0016 
开始 存储 的 ， 因 此 在 读 取样 本 数据 之 前 ， 需 要 先 读 取 4 个 32 位 整数 ， 分 别 是 magic number、 
number of imager 、number of rows 、number of columns。 在 MNIST 中 所 有 图 片 都 是 28x28， 也 
就 是 说 每 个 图 像 都 有 28x28 =784 个 像素 。 

了 解 了 MNIST 数据 集 后 ， 就 可 以 利用 深度 学 习 开 源 框架 TensorFlow 进行 卷 积 神经 网 络 
的 编程 实现 了 。 
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TRAINING SET IMAGE FILE (train-images-idx3-ubyte) 


[offset] [type] [value] [description] 
0000 32 bit integer 0x00000803(2051) magic number 
0004 32 bit integer 60000 number of images 
0008 32 bit integer 28 number of row 
0012 32 bit Integer 28 number of columns 
0016 unsigned byte 好 pixe 
0017 unsigned byte 好 pixe 
YOK unsigned byte 好 pixe 
a) 训练 集 标记 文件 
TRAINING SET IMAGE FILE (train-labels-idx1-ubyte) 
[offset] [typel [value] [description] 
0000 32 bit integer 0x000008031(2049) magic number 
0004 32 bit integer 60000 number of items 
0008 unsigned byte 7 label 
0009 Unsigned byte 22 label 
OX unsigned byte 2 label 


The labels vales are 0 to 9 


b) 训练 集 图 像 文件 
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7-25 MNIST 的 训练 集 标记 文件 和 训练 集 图 像 文件 结构 


首先 按照 下 列 步 又 建立 一 个 project。 
第 一 步 ， 打 开 TensorFlow 的 安装 平台 PyCharm， 如 图 7-26 所 示 。 





File Edit View Navigate Code Refactor Run JTools VCS Window Heip 


am radar 刘 train.py EE TE | ee 驻 
乒 Project 4 全 地 | 痫 -I 
了 Ba radar[flower Fadar 

mm 11 

Pa bin 

PEm demo images 
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Pa docs 

p Paimages 

Pa image1 

Pa image2 

Pa image3 
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图 7-26 PyCharm 运行 界面 
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第 二 步 ， 单 击 左上 和 角 的 名 e 选项 ,在 显示 的 选项 中 选 new project 选项 。 如 图 7-27 
所 示 。 





图 7-27 PyCharm 新 建 工 程 


第 三 步 ， 在 跳出 的 界面 中 ， 为 project 建立 文件 来 ， 注 意 文件 夹 的 名 字 要 用 英文 字母 ， 
不 要 用 中 文 。 如 图 7-28 所 示 。 





7-28 ”PyCharm 新 建 工程 命名 


第 四 步 ， 在 打开 的 project 中 ， 用 鼠标 单 击 左 上 位 置 的 untitled， 然 后 鼠标 右 击 ， 选 中 
new 选项 ， 再 选择 Python file 选项 ， 如 图 7-29 所 示 。 

第 五 步 ， 为 Python file 设置 名 字 ， 同 样 要 使 用 英文 字母 ， 然 后 单 击 OK 选项 ， 如 图 7-30 
所 示 。 

第 六 步 ， 如 图 7-31 所 示 ， 在 右 侧 空白 处 就 可 进行 代码 的 编写 了 。 
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图 7-31 python 代码 编写 界面 
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按照 以 上 步骤 建立 好 project 后 ， 还 需要 到 MNIST 数据 库 的 官方 网 站 (http: // 
yann. lecun. com/exdb/mnist/) 下 载 数 据 集 。 获 得 数据 集 后 ， 在 project 文件 夹 下 新 建 一 个 名 
为 MNIST_ data 的 文件 来， 将 数据 集 放 入 其 中 。 这 样 ， 准 备 工作 就 完成 了 。 

然后 ， 就 可 以 构建 卷 积 神经 网 络 了 。 如 图 7-32 所 示 ， 建 立 了 只 有 一 个 卷 积 层 和 一 个 池 
化 层 的 简单 卷 积 神经 网 络 模型 。 














输入 层 卷 积 层 池 化 层 





图 7-32 卷 积 神经 网 络 简单 模型 


该 模型 中 各 层 作 用 分 别 为 : 

1) 输入 层 : 用 于 对 网 络 进行 数据 输入 。 

2) 卷 积 层 : 使 用 给 定 的 核 函 数 对 输入 数据 进行 特征 提取 ， 并 生成 特征 图 像 。 

3) 池 化 层 : 对 数据 进行 降 维 操作 ， 提 取 显 著 特 征 。 

4) 全 连接 层 : 对 已 提取 出 的 特征 数据 进行 全 连接 计算 ， 并 输出 分 类 结 

在 程序 编写 的 时 候 ， 对 于 MNIST 数据 集 可 以 用 input。 data 函数 来 读 取 相 关 的 数据 样本 ， 
程序 代码 如 下 : 


import tensorflow as tf 




















import tensorflow. examples. tutorials. mnist. input_data as input_data 
mnist =input_data. read_data_sets(" MNIST_data/",one_hot= True) 
x_data=tf. placeholder("float32", [ None, 784] ) 
x_image=tf. reshape( x_data,| -1, 28, 28, 1|]) 
上 述 程序 代码 利用 input。 data 函数 按照 既定 格式 读 取 数据 ， 对 于 类 的 分 类 问题 ， 可 
以 采用 一 个 长 度 为 到 的 数据 来 表示 分 类 结果 ，onehot = True 表示 该 数组 中 只 有 与 分 类 结果 相 
对 应 的 元 素 为 1 0， 其 他 元 素 均 是 0.0。 例如 ,在 nn 为 10 的 情况 下 ， 标 记 为 2， 则 对 应 的 数 
组 结果 为 [0.0 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 ，0.0, 0.0]。 
Placeholder ( ) 是 占 位 符 函 数 ， 插 号 内 的 参数 是 描述 占 位 符 的 参数 ，tf. float32 指 的 是 占 
位 符 接受 类 型 为 float32 的 数据 ，None 表示 行 向 量 的 数 可 以 是 任意 的 ， 图 像 以 行 向 量 的 形式 
进行 描述 ， 对 于 本 例 中 的 手写 体 数据 集 的 图 像 大 小 为 28x28， 因 此 每 个 行 向 量 有 784 个 单 
元 。 由 于 图 像 文件 数据 集 是 以 二 进 制 的 形式 进行 存储 的 ， 因 此 需要 利用 tf. reshape (x，[ -1， 
28，28，1] ) 函数 将 二 进 制 的 数据 还 原 成 288x28 大 小 的 图 像 矩 阵 形式 ，-1 表示 样本 数量 
不 确定 ， 最 后 一 个 参数 表示 颜色 的 通道 数量 ， 因 为 本 例 中 数据 集 的 图 像 都 是 灰 度 图 ， 即 只 具 
有 单 通道 ， 因 此 设 为 1。 如 果 是 彩色 图 像 则 有 具有 三 通道 ， 对 应 值 应 该 设置 为 3。 
接 下 来 创建 一 个 卷 积 层 和 一 个 池 化 层 ， 卷 积 核 大 小 选 为 5x5， 共 用 32 个 不 同 的 卷 积 核 
分 别提 取 32 种 不 同 的 特征 。 池 化 层 采用 最 大 值 池 化 ， 相 应 的 程序 如 下 : 
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w_conv=tf. Variable(t ones([5, 5, 1, 32])) 

b_conv=tf. Variable( tf. ones([32]) ) 

h_conv=tf. nn. relu(tf. nn. conv2d(x_image,w_conv, strides=[1, 1, 1, 1|], padding= 
'SAME ') +b_conv) 

h_pool=tf. nn. max_pool(h_conv, ksize=[1, 2,2,1], stides=[1,2,2,1], padding 
='SAME ') 

上 述 程 序 中 ，w_ conv 是 定义 的 卷 积 核 ，[5, 5, 1, 32] 表示 卷 积 核 是 大 小 为 Sx5， 输 入 
为 1 个 通道 ， 输 出 为 32 个 通道 。 也 就 是 对 一 个 灰 度 图 像 提 取 32 个 特征 。conv2d ( ) 函数 
定义 的 是 一 个 2 维 卷 积 操作 。Strides 表示 卷 积 核 移 动 的 步 长 ，[1，1，1，1] 表示 卷 积 核 逐 
点 移动 。Padding 表示 边界 的 处 理 方式 ， 这 里 取 值 为 “SAME”， 可 使 卷 积 的 输出 和 输入 保持 
同样 的 尺寸 。 选 用 2x2 的 最 大 池 化 方法 ， 即 将 一 个 2x2 的 像素 块 降 为 1xl 的 像素 。 最 大 池 
化 能 够 保留 原 像素 块 中 灰 度 值 最 高 的 那 一 个 像素 ，strides 步 长 设置 为 2， 即 图 像 太 二 会 缩减 
一 半 。 

构建 好 卷 积 层 和 池 化 层 以 后 ， 接 下 来 构建 全 连接 层 ， 程 序 如 下 : 

W_fcl=tf. Variable(tf. ones([14 * 14 * 32, 1024|])) 
b_fcl=tf. Variable( tf. ones(| 1024|])) 

h_pool_flat=tf. reshape(h_pool, [ -1, 14*14*32]) 
h_fc=tf. nn. relu( tf. matmul(h_pool_flat, W_fcl) + b_fc1) 
W_fc2=tf. Variable( tf. ones( [1024, 10|])) 

b_fc2=tf. Variable( tf. ones([10])) 

y_conv=tf. nn. softmax( tf. matmul(h fc，W_ fc2) + b_fc2) 

全 连接 层 在 整个 卷 积 神经 网 络 中 起 到 “分 类 器 ”的 作用 ， 将 学 习 到 的 特征 映射 到 
样本 标记 空间 。 从 上 述 程序 中 可 以 看 出 ， 池 化 后 的 数据 进行 了 重新 展开 ， 将 二 维 数据 
展开 成 一 维 数组 ， 之 后 计算 每 一 行 的 元 素 个 数 ， 最 后 在 输出 层 使 用 softmax 进行 概率 
计算 。 

上 述 程序 中 ，tf. matmul 是 TensorFlow 的 矩阵 乘法 运算 ， 要 求 第 一 个 矩阵 的 列 数 与 
第 二 个 矩阵 的 行 数 相 同 。 

损失 函数 的 计算 程序 如 下 : 


cross_entropy=-tf. reduce_sum(y_data * tf. log(y_conv) ) 











train_step=tf. train. GradientDescentOptimizer( 0. 001). minimize( cross_entropy ) 
init=tf. initialize_all_variables( ) 
sess=tf. Session( ) 
sess. run( init ) 
程序 中 ， 利 用 交叉 箭 作为 损失 函数 ， 交 叉 灶 的 调用 函数 是 - 萎 reduce_ mean ( )。 
train step 为 定义 的 训练 方法 。 程 序 中 利用 GradientDescentOptimizer ( ) 国 数 采用 梯度 下 降 
法 以 0. 001 的 学 习 速 率 对 模型 进行 训练 。 
卷 积 神经 网 络 的 训练 批 次 和 结果 显示 程序 如 下 : 
for in range(1000 ) : 
batch_xs, batch_ys=mnist. train. next_bach(200) 
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sess. run( train_step, feed_dict= |x_data:batch_xs，y_data:batch_ys| ) 
if_% 50 == 0: 
correct_prediction=tf. equal(tf. argmax(y_conv, 1), tf.argemax(y_data, 1)) 
accuracy =tf. reduce_mean( tf. cast( correct_prediction , "float ") ) 
print ( sess. run ( accuracy, feed _ dict = {| x _ data: mnist. test. images, y _ data: 
mnist. test. labels| ) ) 

上 述 程序 中 ,循环 训练 1000 次 ， 每 次 随机 读 取 200 个 样本 数据 ， 每 训练 50 次 ， 就 对 当 
前 训练 数据 的 训练 结果 进行 一 次 检验 。correct。 prediction 作用 检验 卷 积 神经 网 络 的 输出 与 期 
望 值 是 否 匹 配 。tf. equal ( ) 函数 的 返回 值 是 一 系列 的 布尔 值 ， 利 用 萎 csast ( ) 将 布尔 值 
转换 成 浮 点 数 ， 用 于 求 取 平均 值 。 

上 述 卷 积 神经 网 络 的 完整 程序 如 下 : 


import tensorflow as tf 





import tensorflow. examples. tutorials. mnist. input_data as input_data 

mnist =input_data. read_data_sets(" MNIST_data/",one_hot= True) 

x_data=tf. placeholder("float32", [ None, 784] ) 

x_image=tf. reshape(x_data,[ -1, 28, 28, 1]) 

w_conv=tf. Variable(tf. ones([5, 5, 1, 321)) 

b_conv=tf. Variable( tf. ones( [32|])) 

h_conv=tf. nn. relu( tf. nn. conv2d(x_image,w_conv, strides=[1, 1, 1, 1], padding= 
'SAME ') +b_conv) 

h_pool=tf. nn. max_pool(h_conv, ksize=[1, 2,2, 1], strides=|[ 1, 2,2, 1], padding 
='SAME ') 

W_fecl=tf. Variable(t ones([14 * 14 * 32, 1024])) 

b_fcl=tf. Variable (tf. ones([ 1024|)) 

h_pool_flat=tf. reshape(h_pool, | -1, 14*14*32]) 

h fc=tf. nn. relu(tf. matmul(h_pool flat, W_fcl) +b fcel) 

W_fc2=tf. Variable( tf. ones([ 1024, 101)) 

b_fc2=tf. Variable (tf. ones([10])) 

y_conv=tf. nn. softmax(tf. matmul(h fe, W_fc2) + b_fc2) 

y_data=tf. Variable("float32", [None, 10|]) 

cross_entropy= -tf. reduce_sum(y_data * tf. log( y_conv) ) 

train_step=tf. train. GradientDescentOptimizer( 0. 001). minimize( cross_entropy ) 

init=tf. initialize_all_variables( ) 

sess=tf. Session( ) 

sess. run( init ) 

for_in range(1000 ) : 

batch_xs, batch_ys=mnist. train. next_bach(200) 


sess. run( train_step, feed_dict= |x_data:batch_xs, y_data:batch_ys| ) 
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if_% 50= = 
correct_prediction =tf. equal (tf. argmax(y_conv, 1), tf. argemax(y_data, 1)) 
accuracy =tf. reduce_mean( tf. cast( correct_prediction, "float ") ) 
print( sess. run( accuracy ,feed_dict = |x_data: mnist. test. images[ 300:900,: ] ,y_data :mnist. tes 
t. labels[ 300 :900, :] | )) 
述 卷 积 神经 网 络 的 运行 结果 如 图 7-33 所 示 。 


Wsxt - [FAsxt] -Amain,py- PyCharm dition 201 = 





cross_entropy = -tf. reduce_sum(y_*tf. log(y_conv)) 

train step = tf. train. AdamOptimizer (0. 001). minimize (cross_entropy) 
correct_prediction = tf.equal (tf. argmax(y_conv, 1)，tf. argmax(y ,1)) 
accuracy = tf.reduce_mean(tf. cast (correct_prediction, “float”)) 
sess. run(tf. initialize_all_variables ()) 


> Nee aries 51 for i in range(1000) : 
batch = mnist. train. next_batch(200) 
if 1%50 == 0; 
train_accuracy = accuracy. eval (feed_dict={ 
x:batch[0], y_: batch[1], keep_prob: 1.0}) 
print(”step %d, training accuracy %g”’%(i, train accuracy)) 
train_step. run(feed dict={x: batch[0], y_: batch[1], keep_ prob: 0.5}) 


step 850, training accuracy 0.985 
step 900, training accuracy 0.985 
step 950, training accuracy 0.985 


= a 


test accuracy 0.975 


Process finished with exit code 0 





图 7-33 测试 结果 图 











由 图 7-33 可 见 ， 虽 然 该 卷 积 神经 网 络 结构 简单 ， 但 它 对 手写 体 识别 测试 样本 的 识别 准 
确 率 能 达到 97. 5%。 
接 下 来 ， 在 上 述 卷 积 神经 网 络 的 基础 上 ， 再 构建 一 个 多 卷 积 层 和 多 池 化 层 的 卷 积 神经 
网 络 。 
与 之 前 的 简单 神经 网 络 一 样 ， 仍 然 采 用 input_ data 函数 来 读 取 MNIST 数据 集中 的 数据 
样本 ， 具 体 代 码 如 下 : 
import tensorflow as tf 
import tensorflow. examples. tutorials. mnist. input_data as input_data 
sess=tf. InteractiveSession( ) 
mnist=input_data. read_data_sets(" MNIST_data/", one_hot=True) 
因为 网 络 中 含有 多 个 卷 积 层 和 池 化 层 ， 因 此 在 计算 过 程 中 需要 使 用 大 量 的 权 值 和 偏 置 
值 。 为 了 避免 TensorFlow 初始 化 运算 时 反复 进行 格式 化 ， 采 用 如 下 程序 设计 
def weight_variable( shape ) : 
initial =tf. truncated_normal(shape，stddev=0.1) 
return tf. Variable( initial ) 


def bias_variable( shape ) : 
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initial =tf. constant( 0. 1 ，shape=shape) 
return tf. Variable(initial ) 
上 述 程序 中 ，tf. truncated。 normal 初始 化 函数 根据 均值 和 标准 差生 成 一 个 随机 矩阵。 这 
里 是 生成 了 一 个 标准 差 为 0.1 的 随机 矩阵， 而 bias。 variable 函数 先生 成 了 一 个 常 值 为 0.1 的 
和 矩阵， 然后 将 其 强制 转化 为 变量 形式 。 
所 设计 的 卷 积 神经 网 络 中 ， 卷 积 核 参 数 设 为 [1, 1, 1, 1] ， 池 化 层 选 用 2x2 的 池 化 模 
板 ， 具 体 程序 如 下 : 
def conv2d(x, W).: 
return tf. nn. conv2d(x, W, strides=[1, 1, 1, 1], padding=' SAME ') 
def max_pool_2x2(x): 
retum tf. nn. max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding=' SAME ') 
程序 中 的 def conv2d (x, W) 定义 的 是 卷 积 层 ， 其 中 x 是 输入 ，W 是 卷 积 核 参数 。 
Strides 代表 卷 积 核 移 动 步 长 。Padding 代表 边界 的 处 理 方 式 。def max_ pool 2x2(x) 定义 的 
是 池 化 层 ， 使 用 2x2 的 最 大 池 化 。stides 步 长 设置 为 2， 这 样 ， 池 化 后 图 像 尺寸 会 缩减 
一 半 。 
接 下 来 ， 仍 然 使 用 placeholder ( ) 函数 为 接收 数据 定义 存储 空间 ， 程 序 如 下 所 示 : 
x=tf. placeholder( tf. float32, [ None, 784] ) 
y_=tf. placeholder( tf. float32, [ None, 101) 
x_image=itf. reshape(x, [ -1,28,28,1]) 
然后 ， 定 义 第 一 个 卷 积 层 和 池 化 层 。 卷 积 层 使 用 32 个 5x5 大 小 的 卷 积 核 ， 这 样 可 
以 提取 32 种 特征 ， 选 用 relu 激励 函数 。 卷 积 层 后 接 池 化 层 ， 选 用 最 大 池 化 方法 ， 具体 
程序 如 下 : 
W_convl =weight_variable( [5, 5, 1, 32|]) 
b_convl1 =bias_variable( [ 32 |]) 
h_convl =tf. nn. relu( conv2d(x_image, W_convl) + b_conv]1) 
h_pooll =max_pool_2x2( h_conv1) 
接着 定义 第 二 个 卷 积 层 和 池 化 层 ， 这 里 仍然 使 用 5x5 大 小 的 卷 积 核 ， 但 卷 积 核 的 数量 
为 64。 池 化 层 的 池 化 方法 仍然 选用 移动 步 长 为 2 的 最 大 值 池 化 方法 ， 具 体 程序 如 下 : 
W_conv2=weight_variable( [5, 5, 32, 64] ) 
b_conv2=bias_variable( [64 |) 
h_conv2=tf. nn. relu( conv2d(h_pooll, W_conv2) + b_conv2) 
h_pool2=max_pool_2x2( h_conv2) 
至 此 ， 卷 积 层 和 池 化 层 的 程序 编写 完成 。 经 过 前 面 2 次 的 池 化 操作 后 ， 图 像 尺 寸 变 为 原 
图 像 的 1/4， 即 从 28x28 变 为 7x7。 由 于 第 二 个 卷 积 层 的 卷 积 核 数量 为 64， 因 此 输出 的 
tensor 尺寸 为 7x7x64， 使 用 tf. reshape 函数 对 tensor 进行 变换 后 ， 即 可 将 图 像 转化 为 向 量 形 
式 。 之 后 定义 全 连接 层 ， 全 连接 层 的 节点 数 为 1024， 激励 函 数 选用 relu 函数 。 具 体 程序 
如 下 : 
W_fcl=weight_variable([7 x 7 * 64, 1024]) 
b_fcl=bias_variable(| 1024|]) 
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h_pool2_flat=tf. reshape(h_pool2, [-1,7*7*64]) 
h_fcl= nn. relu(tf. matmul(h_pool2 flat, W_fcl) + b_fc1) 
为 了 避免 网 络 出 现 过 拟 合 现象 ， 在 训练 的 过 程 中 按照 keep_ prob 的 概率 随机 丢弃 一 部 
分 节点 数据 ， 激 励 函 数 选 用 Softmax 函数 。 具 体 程序 如 下 . 
keep_prob =tf. placeholder( "float ") 
h fcl_drop=tf. nn. dropout(h_fcl, keep_prob) 
W_fc2=weight_variable( [1024, 101) 
b_fc2=bias_variable( [101) 
y_conv=tf. nn. softmax(tf. matmul(h fcl_drop, W_fc2)+ b_fc2) 
下 面 是 对 损失 函数 的 定义 ， 具 体 程序 如 下 : 
cross_entropy=-tf. reduce_sum(y_* tf. log(y_conv)) 
train_step=tf. train. AdamOptimizer( 0. 0001 ). minimize ( cross_entropy ) 
correct_prediction =tf. equal (tf. argmax(y_conv,1), tf.aremax(y_,1)) 
accuracy =tf. reduce_mean( tf. cast( correct_prediction, "float ") ) 
sess. run( tf. initialize_all_variables( )) 
程序 中 仍然 使 用 梯度 下 降 训练 方法 ， 学 习 速 率 设 为 0.0001。 这 样 ， 就 搭建 出 来 1 个 具 
有 2 个 卷 积 层 和 2 个 赤 化 层 的 卷 积 神经 网 络 。 
接 下 来 就 可 以 开始 训练 网 络 ， 利 用 训练 好 的 卷 积 神经 网 络 就 可 进行 手写 体 输入 的 识别 。 
训练 时 keep_ prob 设置 为 0.5， 而 测试 时 keep_ prob 设置 为 1 0。 具体 程序 如 下 : 
for i in range(1000 ) : 
batch = mnist. train. next_batch( 200) 
i i% 100== 0: 
train_accuracy =accuracy. eval (feed_dict= |x:batch[ 0], y_: batch[ 1], keep_prob: 1.01) 
print("step %d, training accuracy %g "%(i, train_accuracy ) ) 
train_step. run(feed_dict= |x: batch[ 0], y_: batch[ 1|], keep_prob: 0.5}|) 
print("test accuracy %g "accuracy. eval (feed_dict= {x: mnist. test. images[ 800.:1000, : ] ， 
y_:mnist. test. labels[ 800:1000 , : ] , keep_prob: 1.01)) 
上 述 卷 积 神经 网 络 的 完整 程序 代码 如 下 : 
import tensorflow as tf 
import tensorflow. examples. tutorials. mnist. input_data as input_data 
sess=tf. InteractiveSession( ) 
mnist=input_data. read_data_sets(" MNIST_data/", one_hot=True) 
x=tf. placeholder( tf. float32, [ None, 784] ) 
y_=tf. placeholder( tf. float32, [ None, 101) 
def weight_variable ( shape ) : 
initial =tf. truncated_normal(shape，stddev=0.1) 
return tf. Variable( initial ) 
def bias_variable( shape) : 
initial =tf. constant( 0. 1，shape=shape) 
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return tf. Variable (initial ) 
def conv2d(x, W).: 
return tf. nn. conv2d(x, W, strides=[1, 1, 1, 1], padding=' SAME ') 
def max_pool_2x2( x): 
retum tf. nn. max_pool(x, ksize=|[ 1, 2, 2, 1], strides=[1, 2, 2, 1], padding=' SAME ') 
W_convl =weight_variable( [5, 5, 1, 32|]) 
b_convl1 =bias_variable( [ 32 |]) 
x_image=tf. reshape(x, [-1,28,28,1|]) 
h_convl =tf. nn. relu( conv2d(x_image, W_convl )+ b_conv1l ) 
h_pooll =max_pool_2x2( h_conv1) 
W_conv2=weight_variable( [5, 5, 32, 64|]) 
b_conv2=bias_variable( |[ 64|) 
h_conv2=tf. nn. relu( conv2d(h_pooll, W_conv2)+ b_conv2) 
h_pool2=max_pool_2x2( h_conv2) 
W_fcl=weight_variable([7 x 7 * 64, 1024]) 
b_fcl=bias_variable(| 1024 |]) 
h_pool2_ flat=tf. reshape(h_pool2, [ -1,7*7*64]) 
h_fcl=tf. nn. relu( tf. matmul(h_pool2 flat, W_fc1l) +b fcl) 
keep_prob=tf. placeholder( "float ") 
h_fcl_drop= 芋 nn. dropout(h_fcl, keep_prob) 
W_fc2=weight_variable( | 1024, 10|]) 
b_fc2=bias_variable(| 10|) 
y_conv=tf. nn. softmax(tf. matmul(h fcl_drop, W_fc2) + b_fc2) 
cross_entropy=-tf. reduce_sum(y_*{t. log(y_conv)) 
train_step=tf. train. AdamOptimizer( 0. 0001). minimize ( cross_entropy ) 
correct_prediction =tf. equal (tf. argmax(y_conv,1), tf. argmax(y_,1)) 
accuracy=tf. reduce_mean( tf. cast( correct_prediction, "float ") ) 
sess. run( tf. initialize_all_variables( )) 
for i in range( 1000). 
batch = mnist. train. next_batch ( 200) 
i i%100 == 0: 
train_accuracy =accuracy. eval (feed_dict = |x:batch[ 0], y_: batch[ 1], keep_prob: 1.0}) 
print(" step %d, training accuracy %g "%(i, train_accuracy) ) 
train_step. run(feed_dict=|x: batch[ 0], y_: batch[ 1], keep_prob: 0.51) 
print ("test accuracy %g "Yaccuracy. eval( feed_dict= | x: 
mnist. test. images| 800.1000, : | ,y_:mnist. test. labels[ 800. 1000, : ] , keep_prob: 1.0) )) 
该 卷 积 神经 网 络 的 运行 结果 如 图 7-34 所 示 。 
由 图 7-34 可 见 ， 双 卷 积 层 双 池 化 层 的 卷 积 神经 网 络 对 手写 体 数 据 的 识别 率 可 达到 
99. 5% ， 与 单 卷 积 层 单 池 化 层 的 卷 积 神经 网 络 相 比 ， 具 有 更 好 的 识别 性 能 。 
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dow Help 
mainv 有 条 : 
[2 有 GREY 


ME 


» Py MNIST data b_conv2 = bias_variable([64]) 


h_conv2 = tf.nn.relu(conv2d(h_poo11，W_conv2) + b_conv2 


h_pool2 = max_pool]_2x2(h_conv2) 


Wfcl = weight_variable([7 * 7 * 64, 1024]) 
b_fcl = bias_variable([1024]) 


h pool2 flat = tf.reshape (h_poo12，[-1，7#7#64]) 
h fcl = tf. nn.relu(tf. matmul (h_pool2 flat, Wfcl) + b_fcl) 


keep_prob = tf. placeholder ("float”) 
h fcl drop = tf.nn. dropout (h fcl, keep prob) 


= weight_variable ([1024, 10]) 





training accuracy 
step 700, training accuracy 0.98 
step 800, training accuracy 0.99 
step 900, training accuracy 0. 985 


test accuracy 0.995 


Process finished with exit code 0 


图 7-34 测试 结 细 





7 
你 





习题 


1. 卷 积 神经 网 络 一 般 由 哪 几 部 分 组 成 ? 

2. 常用 的 池 化 运算 形式 有 哪 两 种 ? 

3. 卷 积 神经 网 络 中 采用 权 值 共享 有 何 意义 ? 
4. LeNet 网 络 模型 有 哪 几 层 结构 组 成 ? 
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混沌 理论 与 混沌 神经 网 络 


混沌 运动 是 自然 界 中 的 一 种 普遍 运动 形式 。 按 照 牛顿 力学 理论 ， 如 果 给 定 物 体 的 位 
置 和 速度 这 些 初始 条 件 ， 就 可 以 求 出 物体 以 后 任何 时 刻 的 位 置 和 速度 。 这 一 思想 经 拉 
普 拉 斯 推广 ， 表 述 为 一 种 普 适 的 确定 论 思想 ， 并 使 人 们 坚信 : 对 一 个 确定 性 动力 系统 
施加 确定 性 的 输入 ， 则 该 系统 的 输出 一 定 是 确定 的 。 对 于 线性 系统 来 说 ， 这 一 结论 是 
正确 的 ,但 对 于 某 些 非 线 性 系统 ， 则 可 能 出 现 一 种 无 法 精确 重复 、 又 貌似 随机 的 运动 ， 
这 就 是 混沌 。 混 沌 理论 是 确定 论 和 概率 论 之 间 由 此 及 彼 的 一 架 桥梁 。 混 沌 现象 的 发 现 
是 人 类 认识 自然 的 又 一 次 飞跃 。 因 此 也 有 人 将 混沌 理论 、 相 对 论 和 量子 力学 一 起 誉 为 
20 世纪 物理 学 的 三 大 革命 。 


8.1 混沌 研究 的 起 源 与 发 展 


最 早 发 现 混 沌 现象 的 是 法 国 数学 家 庞 加 莱 。1892 年 ， 庞 加 莱 在 研究 三 体 (两 颗 行 
、 一 颗 卫 星 ) 问题 时 发 现 ， 在 同 宿 轨道 或 者 异 宿 轨道 附近 ,方程 的 解 的 状况 非常 复 
杂 ， 即 使 对 于 给 定 的 初始 条 件 ， 也 无 法 预测 较 长 时 间 以 后 的 轨道 状态 。 这 种 对 于 轨道 
长 时 间 行 为 的 不 确定 性 就 是 半 个 世纪 后 数学 家 和 物理 学 家 所 称 的 “混沌 ”。1903 年 ， 
庞 加 莱 在 《科学 与 方法 》 一 书 中 明确 指出 ， 三 体 问题 ， 在 一 定 范 围 内 ， 其 解 是 随机 的 。 
这 实际 上 是 一 种 保守 系统 的 混沌 。 庞 加 莱 把 动力 学 系统 和 拓扑 学 两 大 领域 结合 起 来 ， 
指出 了 混沌 存在 的 可 能 性 。 

1954 年 ， 前 苏联 数学 家 卡尔 马 高 洛 夫 (Kolmosgorov ) 在 阿姆斯特丹 举行 的 国际 数学 会 议 
上 提出 “近似 可 积 的 保守 系统 具有 非常 复杂 的 相 轨 线 ” 的 猜想 。 后 来 他 的 学 生 阿诺德 Ar- 
nold) 做 出 了 严格 的 证 明 ， 莫 塞 尔 (Moser) 又 推广 了 这 些 结果 。 这 就 是 以 他 们 的 姓氏 的 字 
头 命名 的 KAM 定理 。 

20 世纪 60 年 代 开 始 ， 人 们 开始 探索 科学 上 的 莫 测 之 谜 ， 从 而 使 混沌 科学 得 到 了 迅速 的 
发 展 。 

1963 年 ， 美 国 气象 学 家 洛 仑 效 (Lorenz) 在 《大 气 科 学 》 杂 志 上 发 表 了 “决定 性 的 非 
周期 流 ”一 文 ， 指 出 在 气候 不 能 精确 重演 与 长 期 天 气 预报 者 无 能 为 力 之 间 必 然 存 在 着 一 种 
联系 ， 这 就 是 非 周 期 性 与 不 可 预见 性 之 间 的 联系 。 他 还 认为 一 串 事 件 可 能 有 一 个 临界 点 ， 在 
这 一 点 上 ， 小 的 变化 可 以 放大 为 大 的 变化 。 这 些 研究 清楚 地 描述 了 “对 初始 条 件 的 敏感 性 ” 
这 一 混沌 的 基本 性 态 。 

他 采用 数值 积分 法 计算 下 列 三 维 自治 系统 (后 人 称 为 洛 仑 兹 系统 ) 的 初 值 问题 时 发 现 ， 
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当 系 统 参数 取 为 a=10、B=8/3、y=28 时 ， 系 统 的 相 轨 迹 呈 蝴蝶 形状 ， 既 不 重复 也 无 规律 ， 
并 且 与 初 值 无 关 。 
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洛 伦 兹 第 一 次 在 确定 性 动力 系统 中 发 现 了 非 确定 性 现象 ， 成 为 混沌 研究 的 里 程 碑 。 

1964 年 ， 法 国 天 文学 家 赫 农 (Henon) 提出 Henon 映射 ， 并 以 此 解释 了 几 个 世纪 遗留 
下 来 的 太阳 系 的 稳定 性 问题 。 

20 世纪 70 年 代 ， 混沌 学 正式 诞生 。 科 学 家 们 对 混沌 作 了 大 量 的 研究 工作 。1971 年 法 国 
物理 学 家 如 勒 (Ruelle) 和 荷兰 数学 家 塔 肯 斯 (Takens) 提出 了 “奇异 吸引 子 ” 概 念 以 解释 
清流 的 发 生机 制 。 

1975 年 ， 美 籍 华人 学 者 李 天 宕 和 美国 数学 家 约克 (Yorke) 在 《America Mathematics》 
杂志 上 发 表 了 “周期 三 意味 着 混沌 ”的 著名 文章 ， 深 刻 揭示 了 从 有 序 到 混沌 的 演变 过 程 。 
“混沌 ”一 词 正 式 成 为 科学 词汇 。 

1976 年 ， 美 国 数学 生态 学 家 梅 (May) 在 《自然 》 杂 志 上 发 表 了 “具有 极 复 杂 动 力学 
的 简单 数学 模型 ”一 文 ， 提 出 一 些 简 单 的 确定 性 数学 模型 也 可 以 产生 极其 复杂 的 动力 学 行 
为 ， 并 展示 了 Logistic 映射 (也 称 人 口 / 虫 口 模型 ， 的 复杂 动力 学 行为 。 

1977 年 ， 第 一 次 国际 混沌 会 议 在 意大利 召开 ,标志 着 混沌 科学 的 诞生 。 

1978 年 ， 美 国 物理 学 家 费 根 鲍 姆 ( M.J. Feigenbaum) 在 《统计 物理 学 杂志 》 上 发 表 了 
关于 普 适 性 的 文章 “一 类 非 线 性 变换 的 定量 的 普 适 性 ”， 并 发 现 了 从 信和 周期 分 倪 通 往 混 沌 道 
路 上 的 两 个 普 适 常数 ， 为 混沌 研究 打下 了 坚实 的 理论 基础 。 

在 20 世纪 80 年代， 混沌 科学 又 得 到 进一步 发 展 ， 人 们 对 混沌 运动 和 混沌 控制 的 研究 掀 
起 了 新 的 高 潮 。 

1980 年 ， 美 国 数学 家 芒 德 勃 风 (B. Mandelbrot) 用 计算 机 绘 出 了 第 一 张 Mandelbrot 集 的 
图 像 ， 这 是 一 张 五 彩 缤纷 、 绚 丽 无 比 的 混沌 图 像 。 后 来 ， 德 国 的 P. Richter 教授 和 H. Peitgen 
教授 共同 研究 分 形 流 域 的 边界 ， 做 出 了 精美 绝伦 的 混沌 图 像 ， 使 混沌 图 像 成 为 精致 的 艺术 
品 ， 拓 展 了 混沌 科学 的 一 个 重要 应 用 领域 。 

1983 年 ， 加 拿 大 物理 学 家 工 . Glass 在 《物理 学 》 杂 志 上 发 表 著 名 文章 “计算 奇异 吸引 
子 的 奇异 程度 ”， 开 创 了 全 世界 计算 时 间 序 列 维 数 的 热潮 。 

1984 年 ， 中 国 著名 的 混沌 科学 家 部 柏林 编辑 的 《混沌 》 一 书 在 新 加 坡 出 版 ， 为 混沌 科 
学 的 发 展 起 到 了 一 定 的 推动 作用 。 

1986 年 ， 中 国 第 一 届 混 沌 会 议 在 桂林 召开 。 中 国 科 学 家 徐 京华 在 全 世界 第 一 个 提出 三 
种 神经 细胞 的 复合 网 络 ， 并 证 明 它 存在 混沌 。 徐 京华 所 提出 的 复合 神经 网 络 活动 规律 所 绘 的 
图 形 与 人 的 脑 电 图 极为 相似 ， 一 旦 脑 混沌 破坏 ， 人 将 病死 。 

在 20 世纪 90 年 代 ， 混 沌 的 研究 推动 了 其 他 学 科 的 发 展 ， 而 其 他 学 科 的 发 展 又 反 过 来 促 
进 了 对 混沌 的 深入 研究 。 现 在 混沌 科学 与 其 他 科学 相互 渗透 。 无 论 是 在 生物 学 、 后 理学 、 心 
理学 、 数 学 、 物 理学 、 化 学 、 电 子 学 、 信 息 科 学 ， 还 是 天 文学 、 气 象 学、 经 济 学 ， 甚 至 在 音 
乐 、 艺 术 等 领域 ,混沌 都 得 到 了 广泛 的 应 用 。 
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8.2 混沌 的 基本 特性 


混沌 是 指 在 确定 性 系统 中 出 现 的 一 种 貌似 无 规则 的 ， 类 似 随 机 的 现象 。 由 于 混沌 系统 的 
奇异 性 和 复杂 性 至 今 尚 未 被 人 们 彻底 揭示 ， 因 此 混沌 的 定义 至 今 还 未 统一 。 这 里 我 们 仅 从 混 
沌 系统 通常 所 具有 的 基本 特性 来 认识 和 了 人 解 混沌 。 

通常 ， 确 定性 动力 系统 有 三 种 定常 状态 : 平衡 态 、 周 期 运动 和 准 周 期 运动 ， 而 混沌 运动 
不 同 于 上 述 三 种 运动 ， 它 是 一 种 不 稳定 的 有 限定 常 运动 ， 局 限于 有 限 区 域 但 轨迹 永 不 重复 ， 
也 可 认为 是 周期 无 穷 大 的 周期 运动 。 混 沌 运动 具有 如 下 的 独特 特征 。 

1. 有 界 性 

无 论 混沌 系统 内 部 运动 如 何 复杂 和 不 稳定 ， 但 混沌 的 轨 线 始终 限定 在 一 个 确定 的 混沌 吸 
引 域内 ， 并 且 永 远 不 会 越过 该 区 域 。 因 此 从 整体 上 说 ， 混 沌 系统 是 稳定 的 。 

2. 遍历 性 

混沌 运动 在 其 吸引 域内 是 各 态 历 经 的 ， 混 沌 能 够 不 重复 地 历经 混沌 区 内 的 所 有 状态 。 

3. 初 值 敏感 性 

无 限 小 的 初 值 变动 或 微小 扰动 ， 在 足够 长 的 时 间 以 后 ， 会 使 系统 彻底 偏离 原来 的 演化 方 
向 。 这 种 性 质 的 一 个 著名 表述 就 是 蝴蝶 效应 : 

“一 只 巴西 蝴蝶 拍 拍 翅膀 ， 将 使 美洲 几 个 月 后 出 现 比 狂风 还 厉害 的 龙卷风 ， 其 原因 在 
于 : 蝴蝶 翅膀 的 运动 ， 导 致 其 身边 的 空气 系统 发 生变 化 ， 并 引起 微弱 气流 的 产生 ， 而 微弱 气 
流 的 产生 又 会 引起 它 四 周 空气 或 其 他 系统 产生 相应 的 变化 ， 由 此 引起 连锁 反应 ， 最 终 导致 其 
他 系统 的 极 大 变化 。 

蝴蝶 效应 的 姊妹 效应 很 多 。 如 “千里 之 堤 ， 尝 于 蚁 穴 ” 也 是 一 种 混沌 现象 ， 可 称 之 为 
“下 穴 效应 ”。 控 制 论 的 创立 者 维 纳 曾 引用 一 首 民谣 对 混沌 现象 作 了 生动 描述 丢失 一 个 钉 
子 ， 坏 了 一 只 蹄 铁 ; 坏 了 一 只 蹄 铁 ， 折 了 一 匹 战马 ; 折 了 一 匹 战马 ， 伤 了 一 位 骑士 ; 伤 了 一 
位 骑士 ， 输 了 一 场 战斗 ; 输 了 一 场 战斗 ， 亡 了 一 个 帝国 。 这 可 称 为 “ 蹄 钉 效应 ”。 蹄 钉 效 应 
对 混沌 现象 小 误差 的 繁殖 、 生 长 和 逐 级 放大 的 特点 描绘 得 尤其 逼真 。 

4. 内 随机 性 

混沌 具有 类 似 随 机 运动 的 杂乱 表现 ， 但 这 种 表现 与 通常 的 随机 性 又 有 所 不 同 。 它 是 由 确 
定性 动力 系统 在 施加 确定 性 的 输入 后 产生 的 类 似 随 机 的 运动 状态 ， 是 由 混沌 系统 对 初 值 敏感 
性 造成 的 ， 体 现 了 混沌 系统 的 局 部 不 稳定 性 。 

5. 分 维 性 

混沌 系统 的 运动 轨 线 的 维 数 不 是 整数 ， 而 是 分 数 ， 称 为 分 维 。 混 沌 吸引 子 是 一 种 分 维 几 
何 体 。 混 沌 运动 具有 无 限 层次 的 自 相似 结构 ， 说 明 混 沌 运动 是 有 一 定 规律 的 ， 这 是 与 随机 运 
动 的 重要 区 别 之 一 。 

6. 无 标 度 性 

混沌 是 一 种 无 周期 性 的 有 序 态 ， 具 有 无 限 层次 的 多 重 性 与 不 同 层 次 规则 性 的 统一 ， 存 在 
无 标 度 区 域 ， 即 只 要 数值 计算 精度 或 实验 分 辩 率 足够 高 ， 则 可 以 发 现 小 尺寸 混沌 的 有 序 运 
动 ， 与 大 尺寸 的 变化 相似 。 
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7. 普 适 性 
不 同系 统 在 趋 于 混沌 时 会 表现 出 某 些 共同 特性 ， 其 特征 不 因 具 体系 统 和 系统 运动 方程 的 
差异 而 变化 ， 称 为 普 适 性 。 普 适 性 是 混沌 内 在 规律 性 的 体现 。 





8.3 通 往 混沌 的 道路 


混沌 运动 是 确定 性 非 线 性 动力 系统 所 特有 的 复杂 运动 状态 ， 而 且 只 有 当 系 统 参数 处 于 某 
一 范围 时 ， 混 沌 运动 才 可 能 发 后。 通常 ， 通 往 混沌 的 道路 有 倍 周期 分 贫 道 路 、 阵 发 〈( 间 歇 ) 
道路 、 准 周期 道路 和 激 变 等 四 种 方式 。 

1. 倍 周期 分 岔 道路 

倍 周期 分 贫 是 指 由 于 系统 某 一 参数 的 变化 ， 周 期 响应 会 分 岔 成 为 具有 两 倍 周期 的 新 周期 
响应 ， 其 基本 途径 是 : 不 动 点 一 2 周期 点 一 4 周期 点 一 > 无 限 倍 周期 凝聚 一 奇异 吸引 子 。 
费 根 鲍 姆 于 1978 年 发 现 了 从 倍 周期 分 贫 通 往 混 沌 道路 上 的 两 个 普 适 常数 ， 因 此 倍 周期 分 贫 
道路 也 称 为 费 根 饱 姆 道路 。 

2. 阵 发 (间歇 ) 道路 

1980 年 法 国 科学 家 Pomeau 和 Manneville 提出 了 该 条 通 往 混沌 的 道路 ， 因 此 也 称 为 PM 
阵 发 道路 。 

阵 发 性 一 词 来 源 于 满 流 理论 。 在 研究 混沌 中 使 用 阵 发 性 表示 系统 的 时 域 响应 随 着 参数 变 
化 而 出 现 了 随机 交替 的 规则 与 不 规则 运动 ， 随 着 参数 的 继续 变化 ， 不 规则 运动 所 占 时 间 段 越 
来 越 长 ， 最 后 系统 完全 进入 不 规则 运动 。 由 于 不 能 指出 何 时 出 现 混沌 运动 ， 因 此 相应 的 数学 
根据 并 不 很 准确 。 但 数值 实验 和 物理 实验 中 都 已 证 实 了 间 葡 性 的 存在 。 

3. 准 周期 道路 

准 周期 道路 又 称 为 茹 勒 - 塔 肯 斯 道路 。 当 系统 发 生 注 流 时 ， 其 显著 特点 是 系统 同时 存在 
着 多 种 频率 的 振荡 。 因 此 ， 由 于 某 些 参数 的 变化 使 得 系统 内 有 不 同 频率 的 振荡 相互 耦合 时 ， 
系统 就 会 产生 一 系列 新 的 耦合 频率 的 运动 而 导致 混沌 。 茹 勒 和 塔 肯 斯 两 人 在 1971 年 、 纽 豪 
(Newhause) 在 1978 年 分 别 用 实验 证 明了 在 三 次 分 贫 后 ， 规 则 运动 就 变 得 高 度 不 稳定 而 进 





















































和 混沌， 其 典型 途径 是 : 不 动 点 (平衡 态 ) 一 极限 环 (周期 运动 ) 一 二 维 环 面 ( 准 周期 运 
动 ) 一 奇异 吸引 子 (混沌 运动 ) 。 
4. 激 变 


激 变 是 指 混沌 吸引 子 的 数目 或 者 尺寸 在 系统 控制 参数 缓慢 变化 时 发 生 跃 变 的 现象 。 激 变 
可 分 为 边界 激 变 、 内 部 激 变 和 合并 激 变 三 种 情况 。 边 界 激 变 是 指 混沌 吸引 子 突然 出 现 或 消 
失 ; 内 部 激 变 是 指 混沌 吸引 子 尺 寸 突变 ， 合并 激 变 是 指 多 个 混沌 吸引 子 突然 合并 或 一 个 混沌 
吸引 子 突然 分 有 裂 。 产 生 激 变 的 前 提 是 系统 同时 具有 混沌 吸引 子 和 遂 型 不 动 点 。 如 果 不 动 点 的 
稳定 流 形 是 混沌 吸引 子 的 吸引 域 边 界 ， 随 着 系统 参数 变化 ， 混 沌 吸引 子 与 不 动 点 稳定 流 形 间 
距离 不 断 减 小 ， 最 终 与 其 相 接触 。 这 时 混沌 吸引 子 及 其 吸引 域 自 然 一 起 遭 到 破坏 而 消失 ， 即 
为 边界 激 变 。 内 部 激 变 则 是 由 于 随 着 系统 参数 变化 ， 混 沌 吸引 子 在 其 吸引 域内 与 鞍 型 不 动 点 
相 接触 ， 引 起 吸引 子 斥 才 的 突变 。 合 并 激 变 是 多 个 混沌 吸引 子 在 其 吸引 域 公共 边界 上 与 鞍 型 
不 动 点 相 接触 ， 合 并 为 一 。 随 着 系统 参数 变化 ， 吸 引 性 混沌 与 非 吸引 性 混沌 会 经 过 激 变相 互 
转化 。 
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8.4 混沌 的 识别 


判断 系统 是 否 处 于 混沌 状态 对 于 正确 认识 事物 的 规律 具有 重要 的 意义 。 目 前 人 们 已 经 提 
出 几 种 常用 的 混沌 识别 方法 ， 大 致 可 分 为 定性 分 析 和 定量 计算 两 类 方法 。 对 于 指定 系统 混沌 
识别 的 关键 在 于 应 用 多 种 方法 ， 相 互补 充 和 印证 。 


8.4.1 定性 分 析 法 


1. 直接 观测 法 

利用 动力 学 系统 的 数值 运算 结果 绘制 出 相 轨 迹 图 ， 以 及 状态 变量 随时 间 变 化 的 历程 图 ， 
根据 轨迹 的 形状 对 系统 的 性 质 进 行 定性 分 析 和 判断 。 通 常 ， 周 期 运动 的 相 轨迹 为 封闭 曲线 ， 
而 混沌 运动 的 相 轨迹 为 在 一 定 区 域内 随机 分 布 的 永 不 封闭 的 轨迹 。 该 方法 可 以 确定 分 贫 点 和 
普 适 常数 ， 物 理 图 像 清楚 、 直 观 ， 尤 其 是 对 阵 发 混沌 更 是 一 个 很 直接 的 分 析 方 法 。 

2. 分 频 采 样 法 

对 于 周期 外 力作 用 下 的 非 线 性 振子 ， 研 究 其 倍 周期 分 岔 和 混沌 现象 ， 可 采用 分 频 采 样 
法 。 分 频 采 样 方法 是 实验 物理 或 非 线性 振动 理论 中 闪烁 采样 法 的 简单 推广 ， 即 不 限于 按 控制 
频率 的 基本 周期 采样 ， 而 是 按 适当 分 频 ( 即 倍 周 期 ) 采样 。 分 频 采 样 法 是 目前 辨认 长 周期 
混沌 带 的 最 有 效 方法 。 

分 频 采 样 方法 具有 和 快速 傅 氏 变换 一 样 的 两 个 缺点 : 一 是 解释 不 唯一 ， 二 是 不 能 分 辨 比 
采样 频率 更 高 的 频率 。 从 实用 角度 看 ， 分 频 采 样 方法 的 限制 仅仅 是 机 咒 字 长 和 计算 时 间 。 

3. 庞 加 莱 截 面 法 

对 于 含 多 个 状态 变量 的 自治 微分 方程 系统 ， 可 采用 庞 加 莱 截 面 法 进行 分 析 。 其 基本 思想 
是 : 在 多 维 相 空间 中 适当 选取 一 截面 ， 在 此 截面 上 对 某 一 对 共 斩 变 量 取 固 定 值 ， 该 截面 称 为 
庞 加 莱 截 面 。 每 当 轨 道 按 一 定 方向 穿 过 该 面 ， 就 将 相应 的 交点 记录 下 来 ， 这 样 就 得 到 一 个 离 
散 点 列 。 于 是 连续 运动 在 该 平面 中 就 表现 为 离散 点 的 映像 ， 这 就 是 庞 加 莱 映 像 。 庞 加 莱 映 象 
是 研究 分 倪 与 混沌 问题 的 重要 手段 。 

分 析 运 动 轨迹 与 庞 加 莱 截 面 的 交点 〈 庞 加 莱 点 ) 可 得 到 系统 运动 特性 的 信息 。 相 空间 
中 不 同 的 初 值 可 能 对 应 不 同 的 运动 类 型 ， 这 对 于 保守 系统 尤其 如 此 。 只 要 运动 是 有 界 的 ， 轨 
道 穿 过 一 次 庞 加 莱 截 面 后 ， 迟 早 会 第 二 、 三 、 一 一 次 穿 过 。 

若 不 考虑 系统 初始 阶段 的 暂 态 过 程 ， 只 考虑 庞 加 莱 截 面 上 的 稳 态 图 像 ， 则 当 庞 加 莱 截 面 
上 只 有 一 个 不 动 点 或 少数 离散 点 时 ， 运 动 是 周期 的 ; 当 庞 加 莱 截 面 上 是 一 闭 曲线 时 ， 运 动 是 
准 周期 的 ; 当 庞 加 莱 截 面 上 是 成 片 的 密集 点 且 有 层次 结构 时 ， 运 动 是 混沌 的 。 

庞 加 莱 截 面 将 连续 运动 降 为 低 维 的 离散 映 象 。 特 别 是 对 没有 确定 的 频率 可 作 控 制 参数 的 
系统 ， 庞 加 莱 截 面 成 为 研究 它们 的 主要 手段 。 

截面 位 置 的 选择 很 重要 ， 通 常 应 经 过 原来 稳定 而 后 失 稳 的 不 动 点 附近 ， 才 能 反映 出 现 分 
贫 和 混沌 的 过 程 。 由 于 分 岔 序列 往往 伴随 着 在 不 同 几 何 尺 度 上 重复 的 层次 结构 ， 原 则 上 可 以 
靠 分 制 和 限制 空间 范围 与 采样 间隔 提高 分 辩 能 力 。 

4. 相 空间 重 构 法 

当 系 统 的 数学 模型 未 知 时 ， 上 述 分 析 混 沌 行为 的 方法 就 不 再 适用 了 。 此 时 可 考虑 采用 相 
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空间 重 构 理论 进行 动力 系统 分 析 。 

相 空 间 重 构 的 概念 最 早出 现在 统计 学 领域 中 ， 后 被 Packard 、Ruell 、Takens 等 人 先后 引 
入 动力 学 体系 中 。 相 空间 重 构 可 把 具有 混沌 特性 的 时 间 序 列 重建 为 一 种 低 阶 非 线 性 动力 学 
系统 。 

对 于 某 动力 系统 ， 一 般 可 以 通过 实验 方法 观测 得 到 一 组 单 变量 的 时 间 序 列 |x(i;)|}， 通 
过 式 (8-1) ， 可 以 构造 出 一 个 与 原 系统 等 价 的 m 维 吸引 子 ， 从 而 来 研究 这 个 时 间 序 列 的 动 
力学 模型 。 

X(t)= [x(t) ,x(ttTg) ,X(t+274) ,X(t+374) ,X(t+t(m-1) Ti) We (8-1) 

式 中 ，m 为 甬 人 维 数 ，rd 为 重 构 相 空间 矢量 们 (1) 相 邻 两 个 坐标 之 间 的 延迟 时 间 ,“T” 
表示 转 置 。 如 果 重 构 的 相 空间 比较 合适 ， 那 么 原 系统 的 分 数 维 数 以 及 Lyapunov 指数 值 等 一 
些 拓扑 不 变量 就 可 以 得 到 保留 ， 从 而 就 可 以 对 原 系统 的 动力 学 行为 进行 研究 。 重 构 相 空间 的 
轨迹 也 可 反映 系统 运动 状态 的 演化 规律 。 对 于 定 态 ， 重 构 相 空间 中 的 轨迹 是 一 个 定点 ; 对 于 
周期 运动 ， 重 构 相 空间 的 轨迹 是 有 限 个 点 ; 而 对 于 混沌 运动 ， 重 构 相 空间 中 的 轨迹 是 一 些 具 
有 一 定 分 布 形式 或 结构 的 离散 点 。 

假设 原动力 系统 吸引 子 维 数 为 4，Takens 业已 证 明 ， 在 数据 无 穷 多 上 且 不 受 噪 声 污染 的 理 
想 情 况 下 ， 如 果 mm 三 2d+1 时 ， 重 构 的 相 空 间 才 可 以 将 动力 系统 的 拓扑 性 质保 留 下 来 。 对 于 
延迟 时 间 ， 肯 人 理论 没有 做 出 具体 的 要 求 ， 也 没有 提出 具体 的 选择 方法 。 

实验 研究 表明 ， 如 果 延 迟 时 间 ru 选取 的 太 小 ， 相 空间 矢量 于 (1) 的 相 邻 延迟 坐标 元 素 
(如 x ( 与 x (t+rd)) 差别 太 小 ， 即 元 余 较 大 ， 重 构 相 空间 的 样 点 所 包含 的 关于 原 吸引 子 
的 信息 偏 小 ， 表 现在 相 空 间 形态 上 为 信号 轨迹 向 相 空 间 主 对 角 线 压缩 ， 如 果 rd 太 大 ， 相 空 
间 矢 量 对 (1) 的 相 邻 延迟 坐标 元 素 不 相关 ， 则 信息 丢失 ， 信 和 号 轨迹 就 会 出 现 折 释 现象 。 因 
此 ,要求 延迟 时 间 既 不 能 太 小 ， 也 不 能 太 大 。 

为 了 重 构 一 个 合适 的 相 空间 ， 必 须 选 择 一 个 合适 的 延迟 时 间 ru 和 舰 入 维 数 m。 人 们 从 
不 同 的 角度 出 发 ， 已 经 提出 了 很 多 种 选择 延迟 时 间 的 方法 ， 但 到 目前 为 止 ， 还 没有 一 种 通用 
有 效 的 方法 。 相 空间 重 构 参 数 的 选择 仍然 是 当前 的 一 个 热点 研究 问题 。 


8. 4.2 定量 分 析 法 


1. Lyapunov 指数 分 析 方 法 

Lyapunov 指数 在 表征 系统 的 混沌 性 质 方面 一 直 起 着 重要 的 作用 。Lyapunov 指数 是 描述 
一 条 轨道 或 一 个 不 变 集 随 时 间 演 化 的 拉 伸 或 收缩 的 不 变 程 度 ， 或 者 是 邻近 轨道 的 分 离 程度 。 
当 系 统 中 存在 混沌 运动 时 ， 至 少 有 一 个 Lyapunov 指数 为 正 。 一 个 正 的 Lyapunov 指数 意味 着 
在 系统 相 空间 中 ， 无 论 初始 两 条 轨 线 的 间距 多 么 小 ， 其 差别 都 会 随 着 时 间 的 演化 而 成 指数 率 
的 增加 以 致 达到 无 法 预测 ， 这 就 是 混沌 现象 。 

对 于 一 个 耗 散 系 统 来 说 ， 其 相 体 积 一 般 是 要 逐渐 收缩 的 。 这 样 ， 在 耗 散 系统 中 的 混沌 运 
动 存 在 着 两 个 相反 的 过 程 ， 一 方面 是 对 相 空 间 整 体 来 说 ， 远 处 的 轨道 趋向 收缩 到 有 限 的 吸引 
子 范围 内 ; 另 一 方面 是 对 相 空间 具体 点 附近 的 局 部 来 说 ， 它 使 靠近 的 轨道 相互 排斥 。 这 样 ， 
所 有 的 轨道 最 终 集中 在 相 空间 的 有 限 范 围 内 ， 既 相互 靠拢 又 相互 排斥 ， 经 过 无 数 次 的 来 回 折 
合 ， 形 成 复杂 的 混沌 运动 形态 。 

对 于 一 般 的 n 维 离散 动力 系统 ， 定 义 Lyapunov 指数 如 下 : 
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【定义 8-1】 设 是 R* 一 R" 上 的 n 维 映射 , 决定 一 个 nn 维 离散 动力 系统 
Xr1=P (x,) 

将 系统 的 初始 条 件 取 为 一 个 无 穷 小 的 n 维 的 球 ， 由 于 演变 过 程 中 的 自然 变形 ， 球 将 变 为 
椭 球 。 将 椭 球 的 所 有 主轴 按 其 长 度 顺 序 排列 ， 那 么 第 i 个 Lyapunov 指数 根据 第 i 个 主轴 的 长 
度 P,(t) 的 增加 速率 定义 为 

. 1 全 | 
0,=lim—ln i=1,2,.…,n 


PO) 

这 样 ，Lyapunov 指数 是 与 相 空 间 的 轨 线 收缩 或 扩张 的 性 质 相 关联 的 ， 在 Lyapunov 指数 
小 于 零 的 方向 上 轨道 收缩 ， 运 动 稳定 ， 对 于 初始 条 件 不 敏感 ;而 在 Lyapunov 指数 为 正 的 方 
向 上 ， 轨 道 迅 速 分 离 ， 对 初 值 敏 感 。 椭 球 的 主轴 长 度 按 e”' 增 加 ， 由 前 两 个 主轴 定义 的 区 域 
面积 按 e("*e2) 增 加 ， 由 前 3 个 主轴 定义 的 体积 按 er 3) 增加 ， 即 Lyapunov 指数 的 
前 7 个 指数 的 和 ， 由 前 7 个 主轴 定义 的 7 维 立 体 体积 指数 增加 的 长 期 平均 速率 确定 。 

1983 年 ， 格 里 波 基 证 明 只 要 最 大 Lyapunov 指数 大 于 零 ， 就 可 以 肯定 混沌 的 存在 。 因 此 
在 许多 实际 问题 中 ， 往 往 不 需要 计算 所 有 Lyapunov 指数 谱 ， 而 只 要 计算 最 大 的 Lyapunov 指 
数 就 足够 了 。 

Lyapunov 指数 的 常用 计算 方法 有 Wol 方法 、Jacobian 方法 以 及 小 数据 量 方法 等 。 

2. 功率 谱 分 析 法 

功率 谱 可 从 频 域 特性 分 析 系 统 的 运动 状态 。 周 期 运动 的 功率 谱 是 离散 的 ， 仪 包括 基 频 和 
其 谐 波 或 分 频 。 随 机 白 噪声 和 混沌 的 功率 谱 则 是 连续 的 ， 混沌 序列 的 功率 谱 具 有 连续 性 和 宽 
峰 特性 。 但 在 实际 中 ， 对 于 受到 噪声 影响 ， 或 者 周期 很 长 但 数据 有 限 的 序列 ， 很 难 从 谱 特 征 
上 区 分 其 运动 模式 。 

计算 信号 功率 谱 的 方法 可 以 分 为 两 类 : 一 类 为 线性 估计 方法 ， 有 自 相 关 估 计 、 自 协 方差 
法 及 周期 图 法 等 。 另 一 类 为 非 线 性 估计 方法 ， 有 最 大 似 然 法 、 最 大 信 法 等 。 线 性 估计 方法 是 
有 偏 的 谱 估 计 方 法 ， 谱 分 辨 率 随 数据 长 度 的 增加 而 提高 。 非 线性 估计 方法 大 多 是 无 偏 的 谱 估 
计 方 法 ， 可 以 获得 高 的 谱 分 辨 率 。 

3. Kolmogorv 类 

Kolmogorov (K) 炉 是 系统 无 序 程度 的 量度 ， 其 数值 可 用 来 区 分 周期 运动 (K=0)、 混 
沌 运动 (K>0 的 有 限 值 ) 、 随 机 运动 (Ko )。 在 混沌 运动 中 , K 人 越 大 ,信息 的 损失 率 越 
大 ， 系 统 的 混沌 程度 越 大 ， 系 统 也 就 越 复杂 。 

从 时 间 序 列 计算 Kolmogorov 炉 的 方法 主要 有 两 种 ， 即 Schouten 等 提出 的 最 大 似 然 估计 
法 和 Grassberger 等 提出 的 关联 积分 算法 。 

4. 分 形 维 数 分 析 方 法 

分 形 维 数 是 定量 刻画 动力 系统 分 形 特征 的 参数 ， 它 可 以 提供 判断 是 否 存 在 奇异 吸引 子 ， 
是 否 具有 内 在 随机 性 的 依据 。 它 的 大 小 定量 地 提供 了 所 研究 的 复杂 现象 的 复杂 度 。 分 形 维 数 
可 以 有 多 种 定义 和 计算 方法 ， 常 用 的 有 Hausdorff 维 数 、 盒 子 维 数 、 关 联 维 数 、 信 息 维 数 、 
广义 维 数 等 。 


8.5 混沌 应 用 









































近年 来 的 大 量 研究 工作 表明 ， 混 沌 与 工程 技术 联系 越 来 越 密切 ， 它 在 保密 通信 、 优 
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化 计算 、 图 像 处 理 、 生 物 工程 、 化 学 工程 、 电 气 和 电子 工程 、 信 息 处 理 、 控 制 工程 、 
应 用 数学 和 物理 学 、 天 体力 学 等 诸多 领域 都 存在 广泛 的 应 用 前 景 。 下 面 就 几 个 主要 应 
用 方向 进行 介绍 。 

1. 混沌 理论 在 密码 学 中 的 应 用 

混沌 和 密码 学 之 间 有 着 天 然 的 联系 和 结构 上 的 某 种 相似 性 ， 启 示 着 人 们 将 混沌 应 用 于 密 
码 学 领域 。 

言 县 论 的 创始 人 Shannon 指出 : 知 能 以 某 种 方式 产生 一 随机 序列 ， 这 一 序列 由 密 钥 所 确 
定 ， 任 何 输入 值 的 一 个 微小 变化 对 输出 都 具有 相当 大 的 影响 ， 则 利用 这 样 的 序列 就 可 以 进行 
加 密 。 混 沌 系统 由 于 具有 初 值 敏感 性 和 内 随机 性 等 特点 ， 恰 恰 符 合 这 种 要 求 。 

早 在 1949 年 ，Shannon 就 已 经 将 混沌 理论 应 用 到 密码 学 中 ， 并 提出 了 密码 学 中 用 于 指 
导 密 码 设计 的 两 个 基本 原则 ， 扩散 (Diffusion) 和 混乱 (Confusion)。 扩 散 是 将 明文 匈 余 度 
分 散 到 密 文中 ， 使 之 分 散 开 来 ， 以 便 隐藏 明文 的 统计 结构 ， 实 现 方 式 是 使 得 明文 的 每 一 位 影 
响 密 文中 多 位 的 值 。 混 乱 则 用 于 掩盖 明文 、 密 文 和 密 钥 之 间 的 关系 ， 使 密 钥 和 密 文 之 间 的 统 
计 关 系 变 得 尽 可 能 复杂 ， 导 致密 码 攻 击 者 无 法 从 密 文 推 理 得 到 密 钥 。 

从 20 世纪 90 年 代 开 始 ， 混 沌 保密 通信 技术 的 发 展 已 经 经 历 了 四 代 。 混 沌 掩盖 和 混沌 键 
控 技 术 属 于 第 一 代 混 沌 保密 通信 技术 ， 安 全 性 能 比较 低 ， 实 用 性 不 强 。 混 沌 调制 技术 属于 第 
二 代 混 沌 保密 通信 技术 ,尽管 安 全 性 能 比 第 一 代 有 所 提高 ， 但 仍 达 不 到 满意 的 程度 。 混 沌 加 
密 技术 属于 第 三 代 混 沌 保密 通信 技术 ， 该 类 方法 将 混沌 和 密码 学 的 优点 结合 起 来 ， 具 有 非常 
高 的 安全 性 能 。 基 于 脉冲 同步 的 混沌 通信 技术 则 属于 第 四 代 混 沌 保密 通信 技术 。 

2. 混沌 控制 研究 

通过 对 各 种 混沌 现象 产生 机 理 的 研究 ， 人 们 不 断 加 深 和 统一 了 对 混沌 的 理解 。 同 时 ， 也 
逐渐 认识 到 混沌 运动 对 一 些 系统 带 来 的 危害 。 如 混沌 运动 会 使 机 电 系统 或 电路 产生 不 规则 的 
振荡 ， 导 致 系统 运动 完全 偏离 目标 。 一 些 混沌 甚至 会 给 系统 带 来 灾难 性 的 后 果 。 因 此 在 某 些 
实际 系统 中 ， 控 制 混沌 是 非常 重要 的 。 但 是 由 于 混沌 系统 对 初始 条 件 的 极端 敏感 依赖 性 并 由 
此 带 来 的 最 终 不 可 预测 性 ， 现 在 科学 家 虽然 已 经 意识 到 混沌 控制 研究 的 重要 性 ， 但 目前 仍 处 
于 研究 的 初级 阶段 ， 得 到 的 成 果 也 非常 有 限 。 

混沌 控制 方法 有 两 类 ， 一 是 通过 合适 的 策略 、 方 法 及 途径 ， 有 效 地 抑制 混沌 行为 ， 使 
Lyapunov 指数 下 降 进而 消除 混沌 ， 二 是 选择 某 一 具有 期 望 行为 的 轨道 作为 控制 目标 。 一 般 
情况 下 ， 在 混沌 吸引 子 中 的 无 穷 多 不 稳定 的 周期 轨道 常 被 作为 首选 目标 ， 其 目的 就 是 将 系统 
的 混沌 运动 轨迹 转换 到 期 望 的 周期 轨道 上 。 不同 的 控制 策略 必须 遵循 这 样 的 原则 ， 控制 律 的 
设计 须 最 小 限度 地 改变 原 系 统 ， 从 而 对 原 系统 的 影响 最 小 。 从 这 个 观点 来 看 ， 控 制 方式 可 以 
分 为 两 类 : 反馈 控制 和 非 反 馈 控制 。 

反馈 控制 是 一 种 十 分 成 熟 而 且 应 用 广泛 的 工程 设计 技术 ， 它 主要 利用 混沌 系统 的 本 质 特 
征 ， 如 对 于 初始 点 的 敏感 依赖 性 来 稳定 已 经 存在 于 系统 中 的 不 稳定 轨道 。 一 般 来 说， 反馈 控 
制 的 优点 在 于 不 需要 使 用 除 系统 输出 或 状态 以 外 的 任何 有 关 给 定 被 控 系 统 的 信息 ， 不 改变 被 
控 系 统 的 结构 ， 具 有 良好 的 轨道 跟踪 能 力 和 稳定 性 。 其 缺点 在 于 要 求 一 个 比较 精确 的 数学 模 
型 和 输入 目标 函数 或 轨道 ， 在 只 存在 观测 数据 而 没有 数学 方程 时 不 能 直接 使 用 。 

和 反馈 控制 方式 相 比 ， 非 反馈 控制 主要 利用 一 个 小 的 外 部 扰动 ， 如 一 个 小 驱动 信号 、 喉 
声 信和 号、 常量 偏 置 或 系统 参数 的 弱 调 制 来 控制 混沌 ， 该 控制 方式 的 设计 和 使 用 都 十 分 简单 ， 
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但 无 法 确保 控制 过 程 的 稳定 性 。 这 两 种 方式 都 是 通过 混沌 动力 学 系统 的 稍微 改变 来 求 得 系统 
的 稳定 解 。 





在 控制 混沌 的 实现 中 ， 最 大 限度 地 利用 混沌 的 特性 ， 对 于 确定 控制 目标 和 选取 控制 方法 
非常 关键 。 混 沌 控制 的 基本 方法 有 : 0GY 方法 、 连 续 反馈 控制 法 〈 外 力 反馈 控制 法 和 延迟 
反馈 控制 法 ) 、 自 适应 控制 法 以 及 智能 控制 法 (神经 网 络 和 模糊 控制 ) 等 。 

OGY 方法 是 1990 年 美国 马里 兰 大 学 物理 学 家 Ott，Grebogi 和 Yorke 提出 的 一 种 利用 混 
沌 系统 的 内 在 动力 学 特性 的 控制 策略 ， 该 方法 仪 需 对 系统 的 某 一 控制 参数 作 时 变 小 摄 动 ， 就 
可 以 将 系统 的 混沌 运动 稳定 到 指定 的 周期 运动 上 。 其 基本 思想 是 : 先 用 相 空间 重 构 方法 确定 
混沌 吸引 子 中 能 入 的 各 种 不 稳定 周期 运动 ， 选 择 其 中 之 一 作为 控制 目标 ， 等 待 混沌 运动 游荡 
到 该 周期 运动 附近 时 ， 对 系统 某 一 控制 参数 进行 时 变 小 摄 动 ， 将 混沌 运动 稳定 到 指定 的 周期 
运动 上 。 

在 0GY 控制 方法 的 基础 上 ， 德 国 科 学 家 K. Pyragas 在 1993 年 提出 了 外 力 反馈 控制 法 和 
延迟 反馈 控制 法 。 这 两 种 方法 都 可 以 实现 对 混沌 吸引 子 的 连续 控制 ， 使 不 稳定 周期 趋 于 稳 
定 。 外 力 反馈 控制 的 特点 是 用 强迫 信号 激励 系统 ， 并 与 响应 信号 比较 ， 给 出 控制 信号 对 系统 
微 扰 。 其 前 提 是 有 可 控 的 无 穷 多 周期 和 非 周期 轨道 ， 要 求 无 微 扰 系统 存在 混沌 奇异 吸引 子 。 

延迟 反馈 控制 法 利用 系统 响应 信和 号 的 一 部 分 并 经 时 间 延 迟 后 ， 再 与 原来 啊 应 信号 相 减 ， 
其 差 值 作为 控制 信号 反馈 到 系统 。 

自 适应 控制 混沌 运动 是 根据 自 适应 原理 发 展 而 来 ， 由 赫 伯 曼 等 人 提出 的 一 种 方法 。 这 种 
方法 是 通过 参量 的 调整 来 控制 系统 ， 使 其 达到 所 需要 的 运动 状态 ， 调 节 是 依靠 目标 输出 与 实 
际 输出 之 间 的 差 信 号 来 实现 的 。 在 控制 系统 运动 过 程 中 ， 系 统 自身 来 识别 被 控 的 状态 、 性 能 
或 参量 ,将 系统 当前 的 运行 指标 与 期 望 的 指标 加 以 比较 改变 控制 器 的 结构 、 参 量 或 控制 作 
用 ,使 系统 运行 在 其 所 期 望 的 指标 下 的 最 优 或 次 优 状 态 。 

此 外 ， 模 糊 控制 和 神经 网 络 控制 在 混沌 系统 的 控制 研究 中 也 取得 了 一 定 的 研究 
成 果 。 

3. 混沌 的 反 控 制 

混沌 的 反 控 制 所 研究 的 问题 是 指 对 任意 给 定 的 一 个 有 限 维 的 系统 或 过 程 ， 如 何 设 计 一 个 
可 行 的 控制 器 ， 使 受 控 系 统 产 生 混沌 现象 或 增强 受 控 系统 已 经 存在 的 混沌 现象 。 混 沌 的 反 控 
制 。 又 称 为 混沌 化 控制 、 混 沌 的 生成 控制 或 混沌 综合 ， 混 沌 反 控 制 解决 了 混沌 源 的 实现 问 
题 。 目 前 ,混沌 反 控制 的 方法 主要 有 以 下 几 种 : 

1) 基于 Lyapunov 指数 配置 的 混沌 反 控 制 ; 

2) 对 受 控 系统 施加 线性 或 非 线 性 状态 反馈 的 混沌 反 控制 ，; 

3) 通过 对 已 有 混沌 吸引 子 进行 变异 来 实现 混沌 反 控制 ，; 

4) 通过 施加 时 滞 状 态 反馈 或 对 系统 参数 进行 时 滞 参 数 摄 动 来 实现 混沌 反 控 制 ; 

5) 通过 受 控 系 统 状态 对 已 知 混沌 参考 系统 状态 的 精确 跟踪 来 实现 混沌 反 控 制 。 

4. 混沌 优化 方法 

利用 混沌 的 遍历 性 和 随机 性 等 特点 ， 可 实现 复杂 问题 的 高 效 寻 优 。 有 关 混沌 在 优化 算法 
领域 的 应 用 研究 请 参见 9. 4 节 的 相关 内 容 。 
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8.6 混沌 神经 网 络 


将 混沌 理论 与 神经 网 络 相 结合 ， 在 人 工 神 经 元 或 神经 网 络 中 引入 混沌 特性 ， 可 构造 出 混 
沌 神经 网 络 。 与 传统 神经 网 络 相 比 ， 混 沌 神经 网 络 具 有 独特 的 性 能 和 优点 ， 可 对 传统 神经 网 
络 的 性 能 起 到 一 定 的 改善 作用 。 目 前 ， 混 沌 神经 网 络 的 种 类 较 多 ， 产 生 混沌 的 机 制 和 网 络 的 
构成 方式 各 有 不 同 ， 下 面 主要 介绍 目前 研究 相对 成 熟 的 暂 态 混沌 神经 网 络 模型 。 


8. 6. 1 暂 态 混沌 神经 网 络 


目前 ， 在 众多 的 混沌 神经 网 络 中 ， 暂 态 混沌 神经 网 络 的 研究 是 相对 较 早 ， 并 且 应 用 较为 
成 熟 的 网 络 模型 。 该 类 网 络 的 基础 是 Hopfield 网 络 ， 因 此 这 类 网 络 也 属于 反馈 型 神经 网 络 。 
1990 年 ,日 本 学 者 Aihara 等 在 前 人 推导 和 动物 实验 的 基础 上 ,给 出 了 一 个 混沌 神经 网 
络 模型 。 该 模型 在 Hopfield 网 络 的 基础 上 ， 通 过 向 神经 元 中 引入 自 反馈 的 方式 ， 在 神经 元 中 
产生 混沌 特性 ， 从 而 构造 出 混沌 神经 网 络 模型 。 
xi(tt1)=fi(yi(t+1)) 


N M 
yit + 1)= Ky(t) + DVAE) + Dwahlf(y(t))] -ogilfi(y(t))] -0.(1-K) 
j=1 j=1 


J J 
由 于 该 模型 产生 混沌 特性 的 方式 较为 简单 ， 因 此 对 神经 元 的 动力 学 特性 的 控制 也 很 容易 
实现 。 一 般 采 用 衰减 自 反 馈 的 方式 控制 神经 元 的 动力 学 特性 。 网 络 的 工作 过 程 分 为 两 个 阶 
段 ， 第 一 个 阶段 中 神经 元 具有 较 强 的 自 反 馈 ， 神 经 元 处 于 混沌 状态 ， 神 经 网 络 可 按照 混沌 机 
理 进行 遍历 寻 优 。 之 后 ， 网 络 进 入 第 二 个 工作 阶段 ， 神 经 元 的 自 反馈 不 断 衰减 ， 网 络 的 混沌 
特性 不 断 减 弱 ， 最 后 神经 网 络 逐 渐 丧 失 混 沌 特性 而 晓 变 为 普通 的 Hopfield 网 络 ， 进 行 梯度 寻 
优 。 由 于 网 络 第 一 阶段 所 进行 的 遍历 寻 优 可 为 第 二 阶段 的 梯度 寻 优 提供 良好 的 初 值 ， 而 第 二 
阶段 的 梯度 寻 优 具有 较 快 的 搜索 速度 ， 因 此 这 类 网 络 在 寻 优 速度 和 寻 优 效率 等 方面 都 具有 良 
好 的 性 能 。 由 于 混沌 特性 只 存在 于 神经 网 络 工作 的 第 一 个 阶段 ， 并 且 混 沌 特性 逐渐 衰减 消 
失 ， 因 此 该 网 络 称 为 暂 态 混沌 神经 网 络 。 
在 此 模型 的 基础 上 ， 出 现 了 许多 类 似 的 模型 。 例 如 戴 一 其 等 提出 的 具有 和 暂 态 混沌 和 时 变 
增益 的 神经 网 络 模型 ( NNTCTG ) : 
































1 





TI 

yi(it1)= hy(t) ta ( > wixi(t) +1;) -z(t) (xi(t) -Lo) (8-3) 
j=1 #1 

zi(t+t1)= (1-B)z(i) (8-4) 

e(t+1)= (1-y)e,(t) i=1,2,°…,n (8-5) 


式 (8-2) ~ 式 (8-5) 中 ,为 第 i 个 神经 元 的 输出 ，y 为 第 i 个 神经 元 的 内 部 状态 ，w; 
代表 从 第 j 个 神经 元 到 第 i 个 神经 元 的 连接 权 ， 1 为 第 i 个 神经 元 的 输入 偏 置 ，/ 为 一 正常 
数 ，a 为 一 比例 参数 ，k(0<k<1) 为 神经 薄膜 的 衰减 因子 ，z,(1) 0 为 自 反馈 连接 权 ,，B 
(0<B<1) 为 时 变 参量 z (1) 的 衰减 因子 ，si(1) >0 为 输出 函数 的 时 变 增益 参量 ，y(0<y 
<1) 为 时 变 参量 a(1) 的 衰减 因子 。 
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如 果 在 式 (8-2) ~ 式 (8-5) 中 , 令 ej(1) 等 于 一 个 较 大 的 正 数 oe;，z;(t) 等 于 某 个 正 
数 z 以 及 站 =0， 则 该 NNTCTG 就 简化 为 Chen 和 Aihara 等 提出 的 另 一 种 暂 态 混沌 神经 网 络 ， 
该 网 络 模型 如 下 

w(t)=f(y(1) )= 1/| 1+exp( -y(t)/e)] 
yit +1)=ky(t) + a( 2 wnt) + 天) -z(t) (x(t) 一 00) (8-6) 
zi(1+1)= (1-8)ai(?) 

如 果 再 将 式 (8-6) 改 为 

yit + 1)=hky(t) + a(l -z(t))( 2 wr) +1;) -z(t) (x(t) -Lo) 
则 得 到 该 网 络 的 另 一 种 改进 模型 。 
而 王 凌 等 提出 的 基于 退火 策略 的 混沌 神经 网 络 模型 (CSAN) 则 为 
w(t)=f(y(1))= 1/| 1+exp( -yi(1)/e)] 
yi(tt1)= kyi(t) +al Swi D) this) -a(t) (rat) -1) (8-7) 
z(t+1)=z,(t)/[InLet+A(1-z(k-1))|]] 
而 如 果 将 式 (8-7) 改 为 
y(t +1)=hy,(t) + [1 -z(t)/6]a( 2 w(t) +1;—s1) -z(t)(x(t) -1) 
就 又 可 得 到 该 网 络 的 另 一 种 改进 模型 。 
8. 6.2 其 他 类 型 的 混沌 神经 网 络 ” 

1990 年 ，Kaneko 提出 过 一 种 全 局 耦合 映射 模型 (GCM 模型 ) ， 该 模型 利用 Logistic 
映射 作为 激励 函数 ， 可 以 很 容易 地 产生 和 控制 混沌 ， 模 型 的 最 主要 的 特点 是 网 络 单元 
的 演化 过 程 具有 聚 类 的 特性 ， 即 根据 某 一 准则 不 断 地 调整 网 络 参 数 ， 可 最 终 使 网 络 各 
单元 行为 演化 到 若干 类 ， 称 之 为 “ 聚 类 冻结 吸引 子 ”， 这 可 看 作 是 从 混沌 搜索 到 回忆 锁 
定 的 过 程 ， 它 与 生物 实验 结果 相 吻 合 ， 该 模型 可 用 于 联想 记忆 等 问题 的 求解 。 模 型 具 
体形 式 定义 如 下 : 





wi(ntl)= (1-a)f(u(m)) + DAs(n)) 
j=1 


f(x)=ax(1-x),xel[-1,1] (8-8) 
式 (8-8) 中 上 为 Logistic 映射 的 分 义 参 数 ，a el 3.5699,4] 时 为 混沌 映射 。GCM 网 络 
的 时 空 特性 取决 于 分 又 参数 a 以 及 各 单元 间 的 耦合 系数 e。 
在 此 基础 上 ，1996 年 fshii 等 提出 了 改进 的 GCM 模型 (S-GCM ) ， 该 模型 与 GCM 模型 
的 区 别 仅 在 于 该 模型 用 三 次 方 映射 代替 了 Logistic 映射 。 将 该 模型 用 于 字符 的 联想 记忆 可 以 
取得 较 好 的 效果 。 该 模型 可 表述 如 下 : 


sintl)= (1-a)f (um)) + DAs(n)) 
j=1 





f(x)= ox’ -ox+tx 
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1991 年 ，Inoue 等 提出 用 耦合 的 混沌 振荡 子 作 为 单个 神经 元 ， 构 造 混 沌 神经 网 络 的 方 
法 。 耦 合 的 混沌 振荡 子 的 同步 和 异步 分 别 对 应 神经 元 的 激活 和 抑制 两 个 状态 ， 虽 然 混 沌 是 由 
简单 的 确定 性 规则 产生 ， 但 它 包 含 规则 性 和 不 规则 性 两 个 方面 。 耦 合 的 混沌 振荡 子 的 同步 来 
自 规则 性 ， 而 不 规则 性 可 产生 随机 搜索 能 力 。 对 于 离散 时 间 ， 耦 合 的 振荡 子 的 运动 方程 由 
f(x) 和 g(x) 描述 : 





xint+1)=f(x(n)) +D(n) [y(nt+1) -x(nt+1) ] 
yi(nt+1)= g(y(n)) +D(n) Lx(ntl1) -y(nt+1)] 
其 中 ，Di(z) 是 时 刻 n 第 i 个 神经 元 的 看 合 系数 ，X,(n) 和 YY(n) 分 别 是 时 刻 n 第 i 个 
神经 元 第 一 和 第 二 个 振荡 子 变量 。A (x) 和 g (x) 选择 Logisitc 映射 : 
f(x)= ax(1-x),0<a<4 
8(y)= by(1-y) ,0<b<4 
神经 元 有 激活 和 抑制 两 个 状态 ,分 别 用 1 和 0 表示。 第 i 个 神经 元 n 时 刻 的 状态 定义 为 
ee 


U; 一 
Cy 0 else 





其 中 ，s 是 临界 参数 。 

各 种 混沌 神经 网 络 在 不 同 的 领域 表现 出 了 良好 的 应 用 性 能 。 现 有 结果 表明 ， 混 沌 神经 网 
络 在 模式 识别 、 优 化 计算 、 联 想 记 忆 、 保 密 通 信 以 及 系统 建 模 等 众多 方面 都 取得 了 独特 的 应 
用 效果 。 下 面 给 出 一 种 混沌 神经 网 络 的 应 用 实例 。 


8. 6. 3 G-S 混沌 神经 网 络 应 用 实例 


1，G-S 混沌 神经 元 模型 

将 Gauss 函数 和 Sigmoid 函数 组 合 而 成 的 非 单 调 孔 数 作为 神经 元 的 激励 函数 ， 称 该 神经 
元 模型 为 G-S 混沌 神经 元 ， 数 学 模型 可 表述 如 下 : 

x(t+1)=f(yy(t+1)) 
y(tt1)= y(t) tHf( yy(t) )+B 
RO sp) 

x(t) 为 神经 元 在 离散 时 间 t 时 的 输出 ; y(t) 为 神经 元 在 1 时 刻 的 内 部 状态 ;有 为 
神经 隔膜 的 阻尼 因子 ，0<k<1; 从 和 yy 是 正 参 数 ，B 是 与 交 值 有 关 的 参数 。 神 经 元 的 
激励 函数 1 () 由 Gauss 函数 和 Sigmoid 函数 加 和 组 成 。 其 中 c、2 分 别 是 Gauss 函数 和 
Sigmoid 函数 的 中 心 参 数 ，h、c 分别 是 Gauss 函数 和 Sigmoid 函数 的 形状 参数 。 在 合适 的 
参数 情况 下 ， 该 神经 元 模型 会 表现 出 复杂 的 动力 学 特性 。 下 面 通 过 数值 计算 的 方法 来 
分 析 其 动力 学 特性 。 

设 定 模 型 参数 a=-2.1; b=5.0; c=5.0; hh=0.2; k=0.92; 6=0.18; 当选 择 不 同 的 人 
和 时， 模型 的 Lyapunov 指数 如 图 8-1 所 示 。 

在 y-n 所 构成 的 平面 内 ， 在 不 同 的 区 域 中 ， 模 型 处 于 不 同 的 状态 。 在 Lyapunov 指数 大 
于 0 的 区 域内 ， 模 型 处 于 混沌 状态 。 由 此 ， 根 据 图 8-1， 可 以 选择 不 同 的 y 和 来 控制 模型 
的 动力 学 行为 。 

首先 ， 当 固定 久 =0.5， 以 y 为 参 变量 来 研究 其 分 命 特性 并 计算 其 Lyapunov 指数 如 图 8-2 
所 示 。 
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图 8-1 以 人 和 ?7 为 参 变 量 时 ， 神 经 元 的 Lyapunorv 指数 图 
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图 8-2 yy 为 参 变量 时 神经 元 的 
分 岔 图 和 Lyapunorv 指数 图 
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图 8-3 为 参 变量 时 神经 元 的 


分 岔 图 和 Lyapunoyv 指数 图 





随 着 y 的 增 大 ， 神 经 元 的 内 部 状态 出 现 倍 周 期 分 贫 现 象 , 在 y=11.705 时 ， 发 生 第 一 次 
分 岔 ; y=16.019 时 ， 发 生 第 二 次 分 贫 ; …。 在 y>17. 886 时 ， 系 统 处 于 混沌 状态 ， 对 应 的 
Lyapunov 指数 大 于 0。 同样 ， 当 固定 y=21.34 时 , 以 x 为 参 变 量 同样 也 可 控制 神经 元 的 动 
力学 行为 。 分 贫 图 及 Lyapunov 指数 如 图 8-3 所 示 。 当 人 =0. 2437 时 ， 发 生 第 一 次 分 贫 ; 人 = 
0. 4017 时 发 生 第 二 次 分 岔 ; …; j=0.4467 时 系统 处 于 混沌 状态 。 对 应 的 Lyapunov 指数 大 
于 0。 同 时 ， 由 分 岔 图 中 可 见 ， 由 于 模型 的 激励 函数 为 光滑 可 微 的 函数 ， 因 此 在 混沌 带 中 来 


杂 着 大 量 密集 的 周期 窗口 。 当 模型 处 于 混沌 状态 时 ， 
遍历 的 特点 。 同 时 ，Lyapunov 指数 越 大 ， 混 沌 度 则 i 





模型 的 内 部 状态 y 的 运动 呈现 出 随机 、 








戌 大 ， 状 态 遍 历 的 范围 也 相应 增 大 。 在 


优化 计算 中 ， 这 些 特点 可 使 网 络 具 有 跳出 局 部 极 小 点 到 达 全 局 最 优点 的 寻 优 能 
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2. G-S 混沌 神经 网 络 
根据 以 上 分 析 ， 利 用 上 述 神经 元 ， 构 造 一 种 通过 同时 调节 参量 4 和 7 来 控制 网 络 动力 学 
行为 的 G-S 暂 态 混沌 神经 网 络 ， 其 动力 学 方程 可 表述 如 下 : 








, 
yitt1)= y(t 1B ( wrt) +ts1) tu(t) (xi(t) -ss) 
j=1 


wi(tt1)=f(LY(tt1) +1]yi(t+1)) 
HO el 
pt)=p(t-1)/[In[etA(1-p(1-1))]] 
y(1+1)=6y(?) 

B 反 映 了 第 i 个 神经 元 从 其 他 神经 元 获得 贡献 的 能 力 ; wj 表示 从 第 j 个 神经 元 到 第 i 个 
神经 元 的 连接 权 值 ，s1 、s, 表示 神经 元 的 偏 置 。 与 现 有 的 各 种 暂 态 混沌 神经 网 络 不 同 [5]， 
该 神经 网 络 通过 两 种 退 温 衰 减 机 制 y(1) 和 y(t) 共同 作用 来 控制 神经 网 络 的 混沌 特性 。 这 
样 ， 初 始 温度 (0) 和 y(0) 可 以 设 定 为 较 大 的 值 ， 从 而 保证 网 络 在 求解 优化 问题 的 初期 能 
够 经 过 较 充分 的 混沌 搜索 ， 而 两 种 退火 机 制 同时 衰减 ， 又 可 以 保证 网 络 能 够 具有 较 快 的 收敛 
特性 。 在 求解 优化 问题 过 程 中 ， 定 义 能 量 函数 户 满 足 > winy =- 9 /9 x; 。 优 化 问题 求解 
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y* J 
_ 
的 过 程 与 现 有 的 网 络 类 似 ,仍然 分 为 混沌 粗 搜索 和 梯度 精 搜索 两 个 阶段 。 粗 搜索 中 利用 混沌 
的 随机 性 和 轨道 遍历 性 可 使 网 络 具有 克服 局 部 极 小 的 能 
3，G-S 混沌 神经 网 络 在 目标 识别 中 的 应 用 
复杂 目标 的 检测 与 识别 一 直 是 计算 机 视觉 和 图 像 理 解 领域 的 一 个 重要 内 容 ， 在 工业 检 
测 、 军 事 领 域 等 方面 有 着 重要 的 应 用 价值 1 。 神 经 网 络 作为 一 种 智能 信息 处 理 的 方法 在 
目标 识别 中 有 着 较 好 的 应 用 效果 9,19] 。 利 用 本 文 的 暂 态 混沌 神经 网 络 可 以 克服 普通 的 神经 
网 络 容易 陷入 局 部 极 小 点 的 缺点 ， 在 匹配 过 程 中 ， 有 着 更 好 的 效果 。 
首先 ， 在 进行 目标 识别 之 前 ， 分 别 要 对 模型 库 中 的 模板 图 像 和 目标 图 像 进行 特征 点 提 
取 。 图 像 中 用 于 匹配 的 点 应 尽 可 能 容易 地 被 识别 和 匹配 。 显 然 ， 一 个 均匀 区 域 中 的 点 是 不 适 
合作 为 候选 匹配 点 ， 所 以 特征 算 子 应 在 图 像 中 寻找 具有 很 大 变化 的 区 域 。 一 般 认 为 图 像 中 有 
足够 多 相互 分 离 的 区 域 可 以 用 于 匹配 。 
在 以 某 一 点 为 中 心 的 窗 函 数 中 ,使 用 窗 内 所 有 象 素来 计算 其 在 不 同方 向 上 的 变化 量 ， 是 
该 点 在 不 同方 向 上 显著 性 的 一 个 好 测度 。 方 向 变化 量 的 计算 公式 如 下 ; 
n= > Lay) -fxsy +1)]? 


(x,y) eS 


b= > [fx,y) -fx +1,7)]? 


(%,y) eS 


B= > [yy) -fx+1,y+1)]? 


(x,y) eS 
n= 之 [na = lg] 
Xx,y)EeS 
其 中 $ 表示 窗 函 数 中 的 所 有 像素 ， 因 为 简单 的 边缘 点 在 边缘 方 向 上 无 变化 ， 所 以 ， 选 择 
上 述 方向 变量 的 最 小 值 为 中 心 像素 点 (x。，y。) 的 特征 值 ， 可 以 消除 边缘 点 ， 即 
T(x.,y)= min(T ,DL ,bs ,La) 
为 了 避免 将 多 个 相 邻 点 选 为 同一 个 特征 对 应 的 特征 点 ， 可 以 将 特征 点 选 在 特征 测度 函数 
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具有 局 部 最 大 值 的 地 方 ， 且 局 部 最 大 值 大 于 原先 设 定 的 阔 值 。 也 就 是 说 ， 如 果 点 (x*.，y。) 
为 一 个 特征 点 ， 则 Kx ,7 )>1(xz;，7)， (wj;，Y;) 为 点 (x,。，y。) 附近 任 一 点 ， 且 7 了 (x,， 
和 ) > 万 ， 厂 为 靖 值 。 按 照 上 述 方法 即 可 在 模板 图 像 和 目标 图 像 中 分 别 选 出 下 个 和 和 不 特 
征 点 。 

为 了 解决 目标 识别 问题 ， 将 模板 图 像 中 检测 到 的 MM 个 特征 点 按 列 排列 ， 目 标 图 像 中 的 
NN 个 特征 点 按 行 排列 ， 神 经 元 的 输出 矩阵 {v1 为 解 和 矩阵 ，vwj, e 10，1| ,v=1 表示 模板 
图 像 中 的 第 i 个 特征 点 与 目标 图 像 中 的 第 个 特征 点 相 匹 配 ， vj =0 表示 这 两 个 特征 点 不 匹 
配 。 为 了 解决 特征 点 匹配 问题 ， 则 需 定义 一 个 合适 的 能 量 函 数 。 在 不 同 的 情况 下 ， 能 量 函 数 
E 的 定义 形式 应 当 有 所 不 同 。 

如 果 要 对 模板 中 的 W 个 特征 点 与 目标 图 像 中 的 w 个 特征 点 进行 匹配 ， 假 设 : 
1) M=N， 且 模板 图 像 中 的 特征 点 与 目标 图 像 中 的 特征 点 一 一 对 应 ， 则 五 的 形式 定义 为 
E= A > > > camary + (1 -= Do) + cE (1 =- 二 (8-9) 


1=1=17=17= 
2) 如 果 M<N， 目 目标 图 像 中 的 N 个 和 本 征 点 包含 与 模板 图 像 中 相 匹配 的 Wr 个 特征 
点 ， 则 















































N M WN 
=4 A wo + BD (Do) :cE > > ， Vik (8-10) 


E 
i=1 k=1j=11= diy sl 
3) 如 果 MN 中 仅 有 PP 个 点 与 入 中 的 个 点 相 多 本， 则 玉 的 形式 定义 为 


N 


M N M WN N 
Wad a 2 mr oh ) > mp + D (DP Dm -7) 


i=1k=1j=11=1 i=1k=1l= 1i=1j=1,j i=1k= 
(8-11) 
以 上 三 式 中 
C= (dy -dh)? 

其 中 ，d” 表 示 模 板 图 像 中 第 i 个 特征 点 与 第 j 个 特征 点 之 间 的 距离 ，4g 表 示 模 板 图 像 中 
第 个 特征 点 与 第 7 个 特征 点 之 间 的 距离 ， 4、B、C、D 为 加 权 系 数 。 式 (8-9) ~ 式 (8-11) 
的 第 一 项 为 目标 函数 项 ， 其 余 项 为 约束 项 。 

根据 上 述 讨 论 ， 结合 实 际 情况 的 需要 ， 这 里 的 能 量 函 数 选择 式 (8-10) 的 形式 。 也 就 
是 说 ， 在 选取 特征 点 时 ， 要 在 模板 图 像 中 寻找 M 个 特征 点 ， 在 目标 图 像 中 寻找 个 特征 点 ， 
M<N， 并 且 模 板 图 像 中 的 1 个 特征 点 必须 能 够 在 目标 图 像 中 的 w 个 特征 点 中 找到 相 匹 配 的 
NM 个 特征 点 。 为 符合 这 一 和 要求， 模板 中 的 特征 点 要 选择 比较 显著 的 少数 特征 点 作为 模板 特 
征 。 而 目标 图 像 中 的 特征 点 为 了 能 够 包含 与 模板 相 匹 配 的 特征 点 ， 特 征 点 的 选取 要 宽松 些 ， 
也 就 是 说 模板 图 像 的 特征 装 值 1y 要 大 于 目标 图 像 的 特征 阅 值 Jy ， mr >Iw,。 

本 文 以 复杂 背景 下 的 坦克 目标 识别 为 例 进 行 仿真 实验 研究 ， 选 取 一 段 录像 中 的 坦克 图 像 
作为 模板 ， 对 录像 中 的 几 桢 图 像 的 识别 结果 如 下 ， 其 中 左上 顶点 为 坐标 (0，0) ， 向 右 和 向 
下 为 正方 向 。 选 择 如 图 8-4a 所 示 的 110x60 的 坦克 作为 模板 图 像 ， 目 标 图 像 图 8-4b~f 的 大 
小 为 260x170。 

网 络 参数 a=-2.1; b=5.0; c=5.0; h=0.2; k=0.92; 1(0)=0.5; y(0)= 17.3; B= 
0.2; A=0.007; 6=0.9。 由 图 8-4 可 见 , 图 8-4b~f 目标 图 像 特征 点 分 别 为 11，10，10， 
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8-4 ”特征 点 检测 与 匹配 结果 


11， 由 于 在 特征 点 选取 时 , 特征 点 阐 值 设置 为 2000， 低 于 模板 图 像 (图 8-4a) 的 特征 点 阔 
值 2900， 因 此 目标 图 像 的 特征 点 包含 了 模板 图 像 相 应 的 全 部 特征 点 ， 利 用 本 文 提出 的 暂 态 
混沌 神经 网 络 ， 对 于 图 8-4b~e 可 以 得 到 一 组 合法 解 ( 即 解 算 阵 1v;| 的 每 一 行 有 且 只 有 一 
个 1)， 从 而 可 以 准确 地 进行 特征 点 的 匹配 ,识别 出 目标 图 像 中 的 目标 。 而 在 目标 图 像 图 
8-4f 中 ， 由 于 坦克 的 大 部 分 车 身 已 被 山 丘 和 烟雾 所 遮挡 ， 不 能 够 完全 检测 出 与 模板 图 像 相对 
应 的 特征 点 ， 因 此 匹配 算法 给 出 了 一 组 非法 解 (模板 的 多 个 特征 点 对 应 目标 图 像 的 同一 个 
特征 点 ， 也 就 是 解 矩 阵 {v1 的 茶 些 行 1 的 个 数 大 于 2， 而 某 些 行 全 部 为 0) ， 意 味 着 该 目标 
图 像 中 不 包含 所 要 寻找 的 目标 图 像 ， 即 拒 识 该 图 像 。 


习 题 


1. 混沌 的 基本 特性 有 哪些 ? 

2. 判断 系统 是 否 处 于 混沌 状态 的 方法 有 哪些 ? 
3. 通 往 混沌 的 道路 有 哪 四 种 方式 ? 

4. 什么 是 混沌 的 反 控 制 ? 

5. 什么 是 相 空间 重 构 理论 ? 


(228) 


第 9 章 


智能 优化 计算 


在 诸多 人 研究 领域 中 普遍 存在 着 优化 问题 。 例 如 ， 工 程 设计 中 怎样 选择 参数 ， 使 设计 方案 
既 满足 要 求 又 能 降低 成 本 ; 资源 分 配 中 ， 怎 样 分 配 有 限 资源 ， 使 分 配方 案 既 满足 各 方面 的 基 
本 要 求 ， 又 能 获得 好 的 经 济 效益 等 。 因 此 ， 优 化 是 科学 研究 、 工 程 技 术 和 经 济 管理 领域 的 重 
要 研究 对 象 。 而 优化 技术 是 一 种 以 数学 为 基础 ， 用 于 求解 各 种 工程 问题 优化 解 的 应 用 技术 。 

由 于 实际 问题 的 复杂 性 ， 优 化 问题 的 最 优 解 的 求解 是 十 分 困难 的 。20 世纪 80 年 代 以 
来 ， 应 运 而 生 了 一 系列 现代 优化 算法 ， 这 些 算法 在 求解 一 些 复杂 问题 中 取得 成 功 应 用 ， 使 得 
它们 越 来 越 受 到 科技 工作 者 的 重视 。 这 类 算法 通常 都 以 人 类 、 生 物 的 行为 方式 或 物质 的 运动 
形态 为 背景 ， 经 过 数学 抽象 建立 算法 模型 ， 通过 计算 机 的 计算 来 求解 最 优化 问题 ， 因 此 这 些 
算法 也 称 为 智能 优化 算法 。 

近年 来 ， 国 内 外 对 智能 优化 算法 的 研究 异常 活跃 ， 新 的 优化 算法 不 断 出 现 。 例 如 ，1975 
年 ，Holland 提出 了 模仿 生物 种 群 中 优胜 劣 汰 机 制 的 遗传 算法 ( Genetic Algorithms，CA ) ; 
1983 年 ，Kirk-patrick 基于 对 热力 学 中 国体 物质 退火 机 制 的 模拟 ， 提 出 了 模拟 退火 
(Simulated Annealing，SA) 算法 ; 1986 年 ，Glover 通过 将 记忆 功能 引入 最 优 解 的 搜索 过 程 ， 
提出 了 禁忌 搜索 (Tabu Search，TS) 算法 ; 1991 年 ，Dorigo 等 借鉴 自然 界 中 蚂蚁 群体 的 更 食 
行为 ， 提 出 了 蚁 群 优 化 算法 (Ant Colony Algorithms ，ACA ) ; 1995 年 ，Kennedy 和 Eberhart 
受 鸟 群 疯 食 行为 启发 ， 提 出 了 粒子 群 优 化 (Particle Swarm Optimization ，PSO) 算法 。 另 外 ， 
免疫 克隆 选择 算法 (Clonal Selection Algo-rithm，CSA)、 量 子 计算 ( Quantum Computing， 
QC) ， 以 及 国内 学 者 李 晓 春 等 提出 的 鱼 群 算法 等 都 是 较为 常用 的 智能 优化 算法 。 本 章 将 对 其 
中 的 部 分 算法 的 基本 思想 进行 介绍 。 


9.1 优化 问题 的 分 类 


在 第 7 章 中 已 对 优化 问题 做 了 简单 的 介绍 。 优 化 问题 分 为 函数 优化 和 组 合 优化 两 大 类 。 
为 便于 测评 各 种 优化 算法 的 性 能 ， 人 们 提出 了 一 些 典 型 的 测试 函数 和 组 合 优化 问题 。 例 如 ， 
第 用 的 优化 测试 函数 有 : 
Fi=100 (x?-x,) +(1-x1)” -2.048<x,<2.048 
F,=[1+(xi+xy+1)°(19-14x,+3x7?—14x,+6x1%, +3x2) ] x 





















































2 3 2 -2<x;<2 
[ 30+(2x1—3x,) “(18-32x1+12x1+48x, —36%1%2 +27x7 ) ] 
a es 
1 > 1 
FF3=|500 : 2 — 65536 < x; < 65536 


= 
J + 之 《xi 一 oj 
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-32 -16 0 16 32 -32 -16 ... 0 16 32 
"a a S39 200 37% =16 SI ,. B32 30 

sin? 4 二 XI -0.5 


we -0.5 -100<x,<100 
4 (1+0.001(x?2+x2))? i 





x4 
F;= (42 Dj —4+4x3)x? -100<x,<100 


Feo=(x?+x3)0 [sin (S50 (x?+x3)°1)+1.0] 100<x;<100 

组 合 优化 问题 是 通过 数学 方法 的 研究 去 寻找 离散 事件 的 最 优 编排 、 分 组 、 次 序 或 筛选 
等 ， 可 以 涉及 信息 技术 、 经 济 管理 、 工 业 工程 、 交 通 运输 和 通信 网 络 等 许多 方面 。 其 数学 模 
型 描述 为 

目标 函数 : minf(x) 

约束 函数 : s.1. g(x) 宇 0 

有 限 点 集 ， 决 策 变 量 : xeD 

典型 的 组 合 优化 问题 有 : 

(1) 0-1 背包 问题 (0-1 knapsack problem)” 设 背包 容积 为 5， 第 i 件 物 品 单位 体积 
a;， 第 i 件 物 品 单位 价值 为 c;,， 其 中 i=1，2，... ，n。 求 如 何以 最 大 价值 装 包 。 

(2) 旅行 商 问题 (TSP ，traveling salesman problem) ”一 商人 去 nn 个 城市 销 货 ， 所 有 城 
市 走 一 遍 再 回 到 起 点 ， 使 所 走路 程 最 短 。 

(3) 装 箱 问题 (bin packing ) 尺寸 为 1 的 箱子 有 若干 个 ， 怎 样 用 最 少 的 箱子 装 下 个 
尺寸 不 超过 1 的 物品 ， 物 品 集合 为 : |al, ay,...，, a,|l 

(4) N- 皇 后 问题 (N Queens Problem) ”在 NxN 格 的 棋盘 上 ， 放置 NN 个 皇后 。 要 求 每 行 
每 列 放 一 个 皇后 ， 而 且 每 一 条 对 角 线 和 每 一 条 反对 角 线 上 最 多 只 能 有 一 个 皇后 ， 即 对 同时 放 
置 在 棋盘 的 任意 两 个 皇后 (， 廊 ) 和 (is, ho), 不 允许 (i -i, )= (1 - 放 ) 或 者 (i +j )= (is+ 
万 ) 的 情况 出 现 。 

(5) 可 满足 性 问题 (Satisfiability Problem，SAT 问题 ) ”对 于 一 个 命题 逻辑 公式 ， 是 否 
存在 对 其 变 元 的 一 个 真 值 赋值 公式 使 之 成 立 。 

(6) 图 的 m 着 色 问 题 给 定 无 向 连通 图 G 和 m 种 不 同 的 颜色 。 用 这 些 颜色 为 图 6G 的 各 
顶点 着 色 ， 每 个 顶点 着 一 种 颜色 。 如 有 果 有 一 种 着 色 法 使 G 中 每 条 边 的 2 个 顶点 着 不 同 颜色 ， 
则 称 这 个 图 是 m 可 着 色 的 。 图 的 m 着 色 问 题 是 对 于 给 定 图 G 和 m 颜色 ， 找 出 所 有 不 同 的 着 
色 法 。 

9.2 优化 算法 分 类 

如 前 所 述 ， 目 前 优化 算法 的 种 类 众多 ， 按 照 寻 优 机 制 来 看 ， 可 分 为 串 行 优化 算法 和 并 行 
优化 算法 。 

所 谓 串 行 优化 算法 是 指 算法 在 每 次 优化 迭代 计算 中 ， 仪 搜索 解 空间 中 的 一 个 点 (或 状 


态 ) 。 例 如 ， 第 7 章 介绍 的 利用 Hopfield 神经 网 络 或 暂 态 混沌 神经 网 络 实现 的 函数 优化 或 组 
合 优化 计算 就 属于 此 类 。 这 类 方法 每 次 迭代 运算 量 小 ， 运 算 时 间 短 ， 但 通常 为 完成 优化 问题 
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的 求解 ， 所 需 迭 代 次 数 较 多 ， 且 对 复杂 的 优化 问题 求解 能 力 有 限 。 通 常 适 合 于 中 小 规模 的 组 
合 优化 问题 或 不 十 分 复杂 的 函数 优化 问题 的 求解 ， 并 可 用 较 短 的 时 间 以 较 高 的 质量 完成 优化 
问题 的 求解 。 

并 行 优化 算法 是 指 算法 的 寻 优 机 制 通常 采用 类 似 于 种 群 或 群体 的 方式 ， 在 每 次 迭代 计算 
中 可 同时 完成 对 解 空间 的 多 点 搜索 ， 并 提供 多 个 备 选 可 行 解 。 例 如 遗传 算法 、 蚁 群 算法 等 。 
这 类 方法 每 次 的 迭代 运算 量 较 大 ， 通 常 与 种 群 的 规模 直接 相关 ， 但 完成 优化 所 需 的 迭代 次 数 
较 少 ， 且 具有 较 强 的 全 局 寻 优 能 力 。 通 常 适 合 于 大 规模 或 较 大 规模 的 组 合 优化 问题 或 较 复杂 
的 函数 优化 问题 的 求解 。 

另外 ， 还 有 一 些 优化 算法 ， 如 混沌 优化 算法 ， 在 刚刚 提出 时 属于 串 行 搜索 算法 ,但 人 们 
为 了 应 用 其 求解 复杂 优化 问题 ， 在 算法 中 结合 并 行 搜索 机 制 对 其 进行 改进 ， 从 而 发 展 出 并 行 
优化 算法 。 下 面 将 对 各 种 优化 算法 做 较为 详细 的 介绍 。 


9.3 梯度 优化 计算 


梯度 优化 计算 方法 是 指 算法 所 利用 的 启发 式 信息 是 按照 优化 函数 梯度 下 降 的 方向 实现 优 
化 计算 的 。 典 型 的 算法 如 第 7 章 中 所 述 的 Hopfield 神经 网 络 、BP 学 习 算 法 等 。 这 类 方法 在 
优化 过 程 中 启发 式 信息 发 挥 作用 较 大 ， 算 法 收敛 速度 较 快 。 但 算法 不 具有 全 局 寻 优 能 力 ， 所 
得 优化 解 与 初始 解 位 置 有 直接 关系 。 





















































9.4 混沌 优化 





混沌 运动 具有 遍历 性 、 随 机 性 、 规 律 性 、 初 值 敏感 性 等 特点 。 混 沌 运动 能 在 一 定 范围 内 
按 其 自身 规律 不 重复 地 遍历 所 有 状态 。 因 此 ， 利 用 混沌 变量 进行 优化 搜索 ， 无 疑 会 比 随机 搜 
索 具 有 更 好 的 搜索 性 能 。 故 而 ， 优 化 计算 成 为 混沌 应 用 研究 的 方向 之 一 。 

李兵 和 将 慰 孙 1997 年 提出 了 混沌 载波 的 基本 优化 策略 。 在 此 基础 上 ， 张 彤 等 人 结合 变 
尺度 的 思想 提出 了 变 尺度 混沌 优化 方法 。 王 子 才 等 人 则 将 混沌 的 遍历 性 机 制 引入 模拟 退火 算 
法 中 。 

之 后 ， 人 们 又 开始 研究 混沌 发 生机 制 本 身 对 搜索 性 能 的 影响 ， 和 尝试 采用 不 同 的 混沌 发 生 
机 制 产生 搜索 序列 ， 不 断 提 高 搜索 性 能 。 修 春 波 等 人 采用 两 种 混沌 序列 同时 在 解 空间 进行 搜 
索 的 方法 提高 算法 的 通用 性 。 唐 魏 等 采用 寡 函 数 载波 的 方法 提高 混沌 序列 的 遍历 性 。 

为 了 求解 大 规模 优化 问题 ， 人 们 又 提出 了 众多 的 并 行 混沌 优化 搜索 算法 。 求 解 的 范围 也 
逐渐 从 最 初 的 函数 优化 问题 的 求解 扩展 到 组 合 优化 问题 的 求解 。 并 在 火力 分 配 、 电 力 系 统 负 
荷 分 配 、 分 包 商 选择 、 控 制 系统 参数 选取 等 各 种 问题 中 得 到 实际 应 用 。 

本 方 将 对 几 种 典型 的 混沌 优化 算法 的 思想 进行 介绍 。 

1. 基本 混沌 优化 算法 

基本 混沌 优化 算法 思想 比较 简单 ， 主 要 是 采用 混沌 载波 的 方式 将 混沌 状态 引入 到 优化 变 
量 中 ， 将 混沌 运动 的 遍历 范围 映射 到 优化 变量 的 取 值 范围 ， 然 后 利用 混沌 变量 进行 搜索 。 利 
用 混沌 运动 的 遍历 性 、 随 机 性 等 特点 提高 搜索 效率 。 

混沌 变量 的 发 生机 制 选 为 式 (9-1) 的 Logistic 映射 。 
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Nirl = XE lx ) (9-1) 
该 映射 的 混沌 分 又 及 其 对 应 的 Lyapunov 指数 图 如 图 9-1 和 图 9-2 所 示 。 








Lyapunov exponent 























2.5 3.0 3 4.0 
u 


图 9-1 Logistic 映射 分 又 图 图 9-2 Logistic 映射 Lyapunov 指数 图 


当 控 制 参数 v=4. 0 时 ， 该 映射 是 处 于 (0，1) 之 间 的 混沌 满 映 射 。 由 其 产生 的 序列 表 
现 出 了 混沌 系统 的 随机 性 、 遍 历 性 等 基本 特点 ， 具 有 良好 的 搜索 性 能 。 

对 连续 对 象 的 全 局 极 小 值 优 化 问题 

min 帮 xi ,Xp ,X，) Xi E[aibij =1;2，……… ,1 

算法 实现 过 程 如 下 : 

Step1， 利 用 式 (9-1) 产生 nn 个 轨迹 不 同 的 混沌 序列 。 

Step2， 将 混沌 变量 x, 映射 到 优化 变量 的 区 间 内 得 到 搜索 变量 mx,;,， mx;=a;+x; * (6b;,- 
Qi) 。 

Step3， 计 算 搜 索 变 量 的 函数 值 是 否 优 于 当前 最 优 值 ， 如 果 是 ， 则 更 新 当前 最 优 值 ， 和 否 
则 进行 下 一 次 搜索 。 

Step4， 如 果 连 续 独 干 次 搜索 后 ， 最 优 值 始 终 未 获得 更 新 ， 则 实现 第 二 次 载波 ， 即 在 当 
前 最 优 值 附近 确定 新 的 较 小 的 搜索 范围 ， 然 后 继续 搜索 ， 直 到 满足 终止 条 件 为 止 。 

混沌 搜索 虽然 具有 遍历 性 ， 但 要 在 原始 搜索 空间 内 搜索 到 最 优 解 可 能 需要 较 长 的 时 间 。 
因此 基本 混沌 搜索 算法 中 采用 了 二 次 载波 技术 来 提高 搜索 效率 。 由 于 一 次 载波 在 原始 搜索 空 
间 内 实现 了 一 定 次 数 的 粗 搜索 ， 因 此 可 认为 一 次 载波 搜索 结束 后 所 寻 得 的 当前 最 优 解 可 能 处 
于 真正 最 优 解 的 邻 域内 。 而 二 次 载波 所 确定 的 搜索 空间 较 小 ， 相 当 于 是 在 近似 最 优 解 的 邻 域 
内 进行 细 搜 索 ， 从 而 可 有 效 提 高 寻 优 效率 。 

2. 变 尺 度 混 沌 优化 算法 

变 尺度 混沌 优化 算法 是 在 基本 混沌 优化 算法 的 基础 上 提出 的 ， 主 要 特点 是 随 着 搜索 进 
行 ， 不断 缩 小 优化 变量 的 搜索 空间 ， 也 可 看 成 采用 了 多 次 二 次 载波 搜索 。 该 算法 设 定 了 细 搜 
索 标 志 >， 只 要 在 当前 搜索 空间 内 连续 搜索 一 定 次 数 后 最 优 值 未 获得 更 新 ， 则 采用 式 (9-2) 
和 式 (9-3) 缩小 各 变量 的 搜索 范围 。 


rtl 


a, =max| a ,mx, =Yy* (b'-a.) | (9-2) 





























8 =min mx +y: (b'-a) ,0 | (9-3) 
其 中 ,ye (0，0.5) ,ms;* 为 当前 最 优 解 。 上 式 中 的 取 大 取 小 操作 是 为 了 防止 新 范围 超 
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出 原 搜索 空间 。 
在 新 空间 内 进行 第 大 次 混沌 搜索 时 ， 混 沌 搜索 变量 %“* 采 用 当前 混沌 变量 ”与 最 优 变量 
xi 的 线性 组 合 的 形式 得 到 ， 即 











y= ( 1-a)x. +aw" 


水 7 二 1 
mxX. —a. 
i i 





汪汪 
i | rt+l 
b, 一 ai 


{中 a 是 一 个 较 小 的 数 ， 并 且 随 着 搜索 空间 的 缩小 ，a 的 值 不 断 减 小 ， 逐 渐 提 高 最 优 解 邻 域 
围 内 的 搜索 次 数 ， 以 此 提高 搜索 效率 。 

3. 双 混 沌 优化 搜索 算法 

双 混 沌 优化 算法 是 结合 了 最 大 似 然 估计 的 思想 ， 给 出 了 缩小 搜索 空间 的 条 件 ， 从 而 提高 
了 混沌 优化 算法 的 通用 性 。 

如 图 9-3 所 示 ， 算 法 首先 在 已 知 的 搜索 空 
间 A 中 ,利用 两 种 混沌 机 制 x 和 y 进行 独立 并 
行 搜索 ， 当 各 自 搜索 得 到 的 最 优 值 ** 和 yy* 的 
距离 足够 小 时 (例如 同时 在 C 空间 中 时 ) ， 按 
照 最 大 似 然 估 计 的 思想 ， 可 以 估计 真正 的 最 优 
值 就 在 该 空间 附近 (如 B 空间 中 )， 因 此 就 可 
以 将 搜索 空间 从 A 空间 缩小 到 B 空间 。 然 后 ， 图 9-3” 双 混沌 搜索 算法 示意 图 
在 B 空间 中 按 上 述 过 程 继 续 缩小 到 更 小 的 搜索 
空间 ， 直 到 寻找 到 最 优 解 为 止 。 双 混沌 优化 算法 采用 的 两 种 混沌 发 生机 制 分 别 是 Logistic 映 
射 和 立方 映射 。 

4. 窜 函 数 载波 的 混沌 优化 算法 

上 述 混沌 优化 算法 所 采用 的 混沌 发 生机 制 主要 是 Logistic 映射 ,载波 方式 皆 为 线性 载波 
方式 。 虽 然 Logistic 映射 产生 的 混沌 变量 具有 遍历 性 ， 但 其 轨道 点 分 布 却 是 不 均匀 的 ， 表现 
为 区 间 两 端 较 区 间 内 部 点 要 稠密 得 多 。 致 使 其 遍历 性 受到 影响 ， 进 而 影响 算法 的 寻 优 效率 。 

图 9-4 给 出 了 定性 考察 Logistic 映射 遍历 性 的 轨迹 图 。 作 图 方式 为 : 以 zio=0.213 和 zo 
=0. 124 为 初 值 ， 迭 代 2000 次 ， 得 到 两 个 混沌 序列 1z | 和 12 ， 图 中 小 圆圈 代表 二 维 空 
间 中 的 一 点 {21;, zz;1 。 

罕 函 数 载 波 混 沌 优化 算法 采用 短 函 数 载波 的 
方式 改善 了 logistic 映射 轨道 的 遍历 性 ,混沌 变量 
可 在 搜索 区 间 内 更 均匀 地 遍历 搜索 。 所 采用 的 震 
函数 载波 方式 如 下 : 


MN 


[EE 
































2 ZnE [0,a] 


z=1z, znEla,b] 


2 zs Ee [5b,1] 


其 中 ,0<a<b<1, 0<p<1, g>1, z, 为 Logistic 
映射 产生 的 混沌 变量 ,，z' 为 在 帘 函 数 载波 后 重新 图 9-4 Logistie 映射 的 遍历 行 
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获得 的 混沌 变量 。 

在 区 间 [0, a] 中 ， 因 0<p<1， 故 z!' >z,， 使 
得 靠近 区 间 左 端的 点 右 移 ; 在 区 间 [2，1] 中 ， 
因 g>1， 故 z/<z,， 使 得 靠近 区 间 右 端的 点 左 移 ; p 
越 小 ，g 越 大 ， 点 移动 的 距离 越 远 。 而 z 在 [0， 
1] 区 间 内 仍然 保持 有 遍历 性 。 

取 a=0.3, 5=0.8, p= 0.66, gq = 2.48, 
Logistic 映射 窜 孔 数 载波 后 的 遍历 性 轨迹 图 如 图 9-5 
所 不 。 图 9-5 的 遍历 性 

采用 需 函 数 载波 后 的 序列 进行 混沌 优化 搜索 
可 进一步 提高 算法 的 寻 优 效率 。 

5. 并 行 混沌 优化 算法 

以 上 混沌 优化 算法 皆 为 串 行 机 制 的 搜索 算法 。 为 适应 大 规模 优化 问题 的 需要 ， 可 采用 并 
行 混沌 优化 算法 进行 问题 的 寻 优 求解 。 并 行 混沌 优化 算法 的 主要 思想 是 采用 种 群 寻 优 的 策 
略 。 每 一 代 产 生 多 个 搜索 个 体 在 搜索 空间 内 同时 进行 搜索 ， 算 法 根据 较 优 个 体 的 分 布 情况 确 
定 细 搜 索 空 间 的 中 心 位 置 ， 并 不 断 缩小 搜索 空间 的 范围 实现 并 行 寻 优 。 
通常 对 于 中 小 规模 的 优化 计算 问题 ， 串 行 混沌 优化 算法 具有 较 高 的 寻 优 效率 ， 而 对 于 复 
杂 度 高 的 大 型 优化 问题 ， 采 用 并 行 混沌 优化 算法 具有 更 好 的 寻 优 性 能 。 


9.5 模拟 退火 算法 


模拟 退火 算法 (SA) 的 思想 最 早 是 由 Metropolis 在 1953 年 研究 二 维 相 变 时 提出 的 ， 
1983 年 Kirkpatrick 等 人 将 模拟 退火 算法 应 用 于 组 合 最 优化 问题 中 ，Press 和 Tueukolsky 将 单 
纯 形 法 和 模拟 退火 算法 有 机 地 结合 起 来 ， 形 成 一 种 新 的 改进 的 优化 算法 ， 即 单纯 形 模拟 退火 
算法 ， 并 且 成 功 的 解决 了 NLP 问题 。1995 年 Tarek M 等 人 对 SA 算法 进行 了 并 行 化 计算 的 研 
究 ， 提 高 SA 算法 的 计算 效率 ， 用 来 解决 比较 复杂 的 科学 和 工程 计算 。 

1997 年 胡 山 应 等 人 在 求解 无 约束 非 线性 规划 问题 的 SA 算法 基础 上 ， 进 行 有 约束 问题 求 
解 的 进一步 探讨 ， 对 不 等 式 约束 条 件 提 出 了 检验 法 和 罚 函 数 法 的 处 理 方法 ， 对 等 式 约束 条 件 
开发 了 罚 函 数 法 和 解 方程 法 的 求解 步骤 ， 并 进行 了 分 析 比 较 ， 形 成 了 完整 的 求 取 非 线 性 规划 
问题 全 局 优化 的 模拟 退火 算法 。 

模拟 退火 算法 源 于 复杂 组 合 优 化 问题 与 固体 退火 过 程 之 间 的 相似 之 处 。 固 体 的 退火 过 程 
是 一 种 物理 现象 ， 随 着 温度 的 下 降 ， 固 体 粒 子 的 热 运 动 逐 渐 减 弱 ， 系 统 的 能 量 将 趋 于 最 小 
值 。 固 体 退火 过 程 能 最 终 达 到 最 小 能 量 的 一 个 状态 ， 从 理论 上 来 说 ， 必 须 满足 4 个 条 件 : 

1) 初始 温度 必须 足够 高 ; 

2) 在 每 个 温度 下 ， 状 态 的 交换 必须 足够 充分 ; 

3) 温度 的 下 降 必 须 足 够 缓慢 ; 

4) 最 终 温 度 必须 足够 低 。 

模拟 退火 算法 在 系统 向 着 能 量 减 小 的 趋势 变化 过 程 中 ,偶尔 允许 系统 跳 到 能 量 较 高 的 状 
态 ， 以 避 开 局 部 最 小 ， 最 终 稳定 在 全 局 最 小 。 它 的 基本 步 又 如 下 : 
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Step1， 设 系统 初始 化 值 上 较 大 ， 相 当 于 初始 温度 了 足够 大 ， 设 初始 解 为 1， 记 每 个 上 值 
的 迭代 次 数 为 N。 

Step2, 和 迭代 次 数 开 的 范围 k=1, *N, (k=1 初始 ) ， 做 step3 到 step6 操作 。 

Step3， 随 机 选择 一 个 解 j。 

Step4， 计 算 增 量 A=f()) -/(i)， 其 中 A 作 x) 为 评价 函数 。 


seep5， 若 4<0 则 接受 ) 作为 新 的 当前 解 ， 否 则 以 概率 esp| -全 ] 接 受 / 作为 新 的 当前 解 。 


Step6， 如 果 满 足 终止 条 件 则 输出 当前 解 作为 最 优 解 ， 结 束 程 序 。 终 止 条 件 通常 取 为 连 
续 若 干 个 新 解 都 没有 被 接受 时 终止 算法 。 否 则 转 Step7。 

Step7,，t 下 降 次 ,=k+1; 然后 转 step2。 

模拟 退火 算法 按照 概率 随机 地 接受 一 些 劣 解 ， 即 指标 函数 值 大 的 解 。 当 温度 比较 高 时 ， 
接受 劣 解 的 概率 比较 大 。 在 初始 温度 下 ， 几 乎 以 接近 100% 的 概率 接受 劣 解 。 随 着 温度 的 下 
降 ， 接 受 劣 解 的 概率 逐渐 减 小 ， 直 到 当 温 度 趋 于 0 时， 接受 劣 解 的 概率 也 趋 于 0。 这 有 利于 
算法 从 局 部 最 优 解 中 跳出 ， 求 得 问题 的 全 局 最 优 解 。 


9.6 ”遗传 算法 


1975 年 美国 J. Holland 教授 受 生物 进化 论 的 启发 提出 了 一 种 新 的 智能 优化 算法 ， 即 遗传 
算法 (Genetic Algorithm，GCA) 。 该 算 兴 是 基于 适 者 生存 原则 的 一 种 高 并 行 、 随 机 优化 算法 ， 
它 将 问题 的 求解 表示 成 染色 体 的 生存 过 程 ， 通 过 群体 的 复制 、 交 叉 以 及 变异 等 操作 最 终 获得 
最 适应 环境 的 个 体 ， 从 而 求 得 问题 的 最 终 解 。GA 抽象 于 生物 体 的 进化 过 程 ， 通 过 全 面 模拟 
自然 选择 和 遗传 机 制 ， 形 成 一 种 具有 “生成 + 检验 ”特征 的 搜索 算法 。 它 以 编码 空间 代替 问 
题 的 参数 空间 ， 以 适应 度 函 数 为 评价 依据 ， 以 编码 群体 为 进化 基础 ， 以 对 群体 中 个 体位 串 的 
遗传 操作 实现 选择 和 遗传 机 制 ， 建 立 起 一 个 迭代 过 程 。 在 这 一 过 程 中 ， 通 过 随机 重组 编码 位 
串 中 重要 的 基因 ， 使 新 一 代 的 位 串 集 合 优 于 老 一 代 的 位 串 集 合 ， 群 体 的 个 体 不 断 进化 ， 逐 渐 
接近 最 优 解 ， 最 终 达 到 求解 问题 的 目的 。GA 作为 一 种 通用 的 优化 算法 ， 其 主要 特点 是 群体 
搜索 策略 和 群体 中 个 体 之 间 的 信息 交换 ， 搜 索 不 依赖 于 梯度 信息 。 随 着 计算 机 技术 的 不 断 发 
展 ， 遗 传 算法 在 模式 识别 、 神 经 网 络 、 组 合 优化 以 及 图 像 处 理 等 领域 取得 了 成 功 的 应 用 。 本 

节 将 介绍 简单 遗传 算法 的 关键 参数 与 操作 、 算 法 流程 以 及 算法 的 改进 与 简单 实现 。 


9. 6. 1 遗传 算法 中 的 关键 参数 与 操作 


GA 是 模拟 遗传 选择 和 自然 淘汰 的 生物 进化 过 程 的 计算 模型 ， 所 涉及 的 关键 参数 与 操作 
主要 有 以 下 几 点 : 

1. 编码 

GA 中 的 编码 (Encoding) 即 是 将 一 个 问题 可 行 解 从 解 空间 转换 到 GA 所 能 处 理 的 搜索 
空间 的 转换 过 程 。 在 GA 的 研究 发 展 过 程 中 ， 提 出 了 许多 不 同 的 编码 方式 ， 而 采用 不 同 的 编 
码 方式 对 问题 的 求解 精度 与 效率 有 很 大 影响 。 通 常 ， 问 题 编码 一 般 应 满足 以 下 3 个 原则 : 

(1) 完备 性 (Completeness) ”问题 空间 中 的 所 有 点 (潜在 解 ) 都 能 成 为 GA 编码 空间 
中 的 点 (染色 体位 串 ) 的 表现 型 。 
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(2) 健全 性 (Soundness) ”GA 编码 空间 中 的 染色 体位 串 必须 对 应 问题 空间 中 的 某 一 潜 
在 解 。 

(3) 非 兄 余 性 〈(Non-redundancy) ”染色体 和 潜在 解 必须 一 一 对 应 。 

在 某 些 情况 下 ， 为 了 提高 遗传 算法 的 运行 效率 ， 人 允许 生成 包含 致死 基因 的 编码 位 串 ， 他 
们 对 应 于 优化 问题 的 非 可 行 解 。 虽 然 这 会 导致 元 余 或 无 效 的 搜索 ， 但 可 能 有 助 于 生成 全 局 最 
优 解 所 对 应 的 个 体 ， 求 解 问 题 所 需要 的 总 计算 量 反 而 会 减少 。 

上 述 的 3 个 编码 原则 虽然 带 有 普遍 意义 ,但 是 缺乏 具体 的 指导 思想 ， 特 别 是 满足 这 些 规 
范 的 编码 设计 不 一 定 能 有 效 地 提高 遗传 算法 的 搜索 效率 。 相 比 之 下 ，De Jong 提出 较为 客观 
明确 的 编码 评估 准则 ， 称 为 编码 原理 ， 又 称 为 编码 规则 : 

(1) 有 意义 基因 块 编码 规则 所 设计 的 编码 方案 应 当 易 于 生成 所 求 问题 相关 的 短 定义 
距 和 低 阶 的 基因 块 。 

(2) 最 小 字符 集 编码 规则 ”所 设计 的 编码 方案 应 采用 最 小 字符 集 以 使 问题 得 到 自然 的 
表示 或 描述 。 

这 里 ， 基 因 块 的 定义 距 是 指 基因 块 中 第 一 个 确定 位 置 和 最 后 一 个 确定 位 置 之 间 的 距离 。 
基因 块 的 阶 表示 基因 块 中 已 有 明确 含义 的 字符 个 数 。 阶 数 越 低 ， 说 明基 因 块 的 概括 性 越 强 ， 
所 代表 的 编码 串 个 体 数 也 越 多 。 

目前 最 常用 的 编码 方式 为 二 进 制 编码 ， 此 种 编码 简单 易 用 ， 并 依 此 提出 了 模式 定理 。 
即 : 具有 低 阶 、 短 定义 距 以 及 平均 适应 度 高 于 种 群 平均 适应 度 的 模式 在 子 代 中 时 指数 增长 。 
它 保证 了 较 优 的 模式 (遗传 算法 的 较 优 解 ， 的 数 日 呈 指 数 增长 ， 为 解释 遗传 算法 机 理 提供 
了 数学 基础 。 除 此 之 外 ,还 有 灰 度 编码 、 实 数 编码 、 符 号 编码 等 编码 方式 。 例 如 ， 对 于 求实 
数 区 间 [0,，3] 上 也 数 /(x)= -(*-1) +6 的 最 大 值 ， 传 统 方法 是 通过 逐步 调整 x 的 值 来 获 
得 该 函数 的 最 大 值 ， 而 GA 则 是 将 参数 进行 编码 形成 位 串 并 对 其 进行 进化 操作 。 例 如 ， 采 用 
二 进 制 编码 方式 可 以 由 长 度 为 5 的 位 串 表 示 变 量 x， 即 从 “00000” 到 “11111”， 并 将 取 值 
映射 到 区 间 [0，3] 内 。 从 整数 上 看 ，5 位 长 度 的 二 进 制 编码 位 串 可 以 表示 0 到 63 ， 对 应 
区 间 每 个 相 邻 值 之 间 的 阶 跃 值 为 3/63 = 0. 0476， 即 编码 精度 。 从 中 可 以 找到 二 进 制 编码 中 
位 串 长 度 与 编码 精度 之 间 的 对 应 关系 。 假 设 位 串 长 度 为 工 则 对 应 整数 区 间 为 [0~22-1] ， 
若 实际 参数 的 定义 域 为 [a，6] ， 则 编码 精度 为 《5-a)/(2:-1) 。 一 般 来 说 ， 编 码 精度 越 
高 ， 所 得 到 解 的 质量 也 越 好 ， 但 操作 所 需要 的 计算 量 也 越 大 ， 算 法 运算 时 间 也 越 长 。 因 此 在 
解决 实际 问题 时 ， 应 适当 选择 编码 位 数 。 

此 外 ， 对 于 问题 的 变量 是 实 向 量 的 情况 ， 可 以 直接 采用 实数 编码 。 实 数 编码 就 是 采用 十 
进 制 进行 编码 ， 直 接 在 解 空间 上 进行 遗传 操作 。 这 种 方法 在 求解 高 维 问题 或 者 复杂 优化 问题 
时 采用 的 较 多 。 实 验证 明 ， 对 于 大 部 分 数值 优化 问题 ， 通 过 引入 一 些 专门 设计 的 遗传 算 子 ， 
采用 实数 编码 比 采 用 二 进 制 编码 时 算法 的 平均 效率 要 高 。 由 于 实数 编码 表示 比较 自然 ， 容 易 
引入 相关 领域 的 知识 ， 加 入 启发 式 信息 以 增加 搜索 能 力 ， 所 以 它 的 使 用 越 来 越 广泛 。 

其 他 非 二 进 制 编码 往往 要 结合 问题 的 具体 形式 。 一 方面 简化 编码 和 解码 过 程 ， 另 一 方面 
可 以 采用 非 传 统 操作 算 子 ， 或 者 与 其 他 搜索 算法 相 结合 。 主 要 有 大 字符 集 编 码 、 序 列 编码 、 
树 编码 、 自 适应 编码 及 乱 序 编码 等 。 

2. 适应 度 函 数 

适应 度 函 数 主要 用 于 对 个 体 进 行 评价 。 在 对 简单 问题 进行 优化 时 ， 通 常 可 以 直接 采用 目 
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标 函 数 作为 GA 的 适应 度 函 数 ， 例 如 f(x) 为 某 一 问题 的 目标 函数 ， 则 适应 度 函 数 F(x) 可 
以 采用 M-f(x)， 其 中 M 为 一 足够 大 正 数 。 在 复杂 问题 的 优化 过 程 中 ,通常 需要 根据 问题 的 
特点 构造 评价 函数 以 适应 GA 的 优化 过 程 。 

遗传 算法 将 问题 空间 表示 为 染色 体位 串 空 间 ， 为 了 执行 适 者 生存 的 原则 ， 必 须 对 个 体位 
串 的 适应 度 进行 评价 。 因 此 ， 适 应 函数 ( Fitness function) 就 构成 了 个 体 的 生存 环境 。 根 据 
个 体 的 适应 值 ， 就 可 决定 它 在 此 环境 下 的 生存 能 力 。 一 般 来 说 ， 好 的 染色 体位 串 结构 具有 上 比 
较 高 的 适应 函数 值 ， 即 可 以 获得 较 高 的 评价 ， 具 有 较 强 的 生存 能 

由 于 适应 值 是 群体 中 个 体 生 存 机 会 选择 的 唯一 确定 性 指标 ， 所 以 适应 函数 的 形式 直接 决 
定 着 群体 的 进化 行为 。 根 据 实际 问题 的 经 济 含义 ， 适 应 值 可 以 是 销售 、 收 入 、 利 润 、 市 场 占 
有 率 、 商 品 流通 量 或 机 器 可 靠 性 等 。 为 了 能 够 直接 将 适应 函数 与 群体 中 的 个 体 优 劣 度 相 联 
系 ， 在 遗传 算法 中 适应 值 规定 为 非 负 ， 并 且 在 任何 情况 下 总 是 希望 越 大 越 好 。 

若 用 S“ 表 示 位 串 空间 ，S* 上 的 适应 位 函数 可 表示 为 f( ， ) : S 一 R ， 为 实 值 函 数 ， 其 中 
R' 表 示 非 负 实 数 集合 。 

对 于 给 定 的 优化 问题 optg (x) (x e [u,v])， 目标 函数 有 正 有 人 负 ， 其 至 可 能 是 复数 值 ， 
所 以 有 必要 通过 建立 适应 函数 与 目标 函数 的 映射 关系 ,保证 映射 后 的 适应 值 是 非 负 的 ， 而 且 
目标 函数 的 优化 方向 应 对 应 于 适应 值 增 大 方向 。 

针对 进化 过 程 中 关于 遗传 操作 控制 的 需要 ， 选 择 函 数 变换 7: g 一 f/， 使 得 对 于 最 优 解 
x” ,maxf (x” )=opt g(x” ) (x” el[u,v])。 

(1) 对 最 小 化 问题 ， 建 立 如 下 适应 函数 f(x) 和 目标 函数 g(x) 的 映射 关系 : 

Cmax “8(%) SCX%) <cnax 
An 其 他 

其 中 ，c,, 可 以 是 一 个 输入 值 或 是 理论 上 的 最 大 值 ， 或 者 是 到 当前 所 有 代 或 最 近代 中 
g(x) 的 最 大 值 ， 此 时 c，, 随 着 代数 会 有 变化 。 

(2) 对 于 最 大 化 问题 ,一 般 采 用 下 述 方法 : 

BX)TCmn 8(%)>cmin 
An 其 他 

式 中 ，ci, 既 可 以 是 特定 的 输入 值 ， 也 可 以 是 当前 所 有 代 或 最 近代 中 g(x) 的 最 小 值 。 

若 opt g(x) (xe [u,v]) 为 最 大 化 问题 ， 且 min(g(x)) 宇 0 (xe [u,v])， 仍然 需 要 针 
对 进化 过 程 的 控制 目标 选择 某 种 函数 变换 ， 以 便于 制定 合适 的 选择 策略 ， 使 得 遗传 算法 获得 
最 大 的 进化 能 力 和 最 佳 的 搜索 效果 。 

3. 算法 参数 

GA 中 的 算法 参数 主要 有 种 群 数目 、 交 叉 概 率 、 变 异 概率 等 。 一 般 来 说 ， 种 群 数目 直接 
影响 算法 的 优化 效率 与 结果 。 当 种 群 数目 太 小 时 ， 则 不 能 提供 足够 多 的 采样 点 ， 使 算法 性 能 
很 差 并 可 能 得 不 到 可 行 解 ， 当 种 群 数目 太 大 时 ， 则 会 增加 算法 的 运行 时 间 ， 降 低 算法 的 运行 
效率 。 在 这 里 需要 说 明 的 是 ， 在 GA 优化 过 程 中 种 群 数目 是 允许 变化 的 。 

交叉 概率 用 于 控制 交叉 操作 的 频率 ， 当 交叉 频率 过 大 时 ， 种群 中 的 位 串 更 新 过 快 ， 从 而 
会 使 高 适应 值 的 个 体 被 过 快 破坏 掉 ; 当 交 叉 频 率 过 小 时 ， 导 致 很 少 发 生 交 叉 操 作 ， 从 而 容易 
使 搜索 停滞 。 

变异 概率 的 大 小 直接 影响 着 种 群 的 多 样 性 。 在 二 进 制 编码 的 GA 中 ， 较 小 的 变异 率 完 全 
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可 以 避免 整个 种 群 中 任 一 位 置 的 基因 一 直 保 持 不 变 ， 但 概率 太 小 则 不 会 产生 新 的 个 体 ， 概 率 
太 大 则 使 GA 成 为 了 随机 搜索 。 

4. 算法 操作 

GA 作为 模拟 生物 进化 论 的 一 种 工程 模型 ， 它 的 主要 价值 不 仅 在 于 能 够 对 优化 问题 给 出 
一 种 有 效 的 计算 方法 ， 而 且 遗 传 算法 的 结构 中 包含 了 大 自然 所 赋予 的 一 种 哲理 ， 在 科学 思想 
方法 上 给 予 人 们 以 深刻 的 启迪 。 在 GA 中 主要 的 遗传 操作 包括 选择 ( Selection ,或 复制 Re- 
production) 、 交 叉 ( Crossover， 或 重组 Recombination) 和 变异 ( Mutation ) 三 种 基本 形式 ， 
它们 构成 了 遗传 算法 具备 强大 搜索 能 力 的 核心 ， 是 模拟 自然 选择 以 及 遗传 过 程 中 发 生 的 繁 
殖 、 杂 交 和 变异 现象 的 主要 载体 。 

选择 (Selection) 是 遗传 算法 的 关键 ， 它 模拟 了 生物 进化 过 程 中 自然 选择 规律 。 选 择 是 
由 某 种 方法 从 群体 4 (t) 中 选取 w 个 个 体 放 入 交配 池 ， 交 配 池 是 用 于 繁殖 后 代 的 双亲 个 体 
源 。 选 择 的 根据 是 每 个 个 体 对 应 的 优化 问题 目标 函数 转换 成 的 适应 度 函 数值 的 大 小 ， 适 应 度 
函数 值 大 的 被 选中 的 机 会 就 多 ， 即 越 适合 于 生存 环境 的 优良 个 体 将 有 越 多 的 繁殖 后 代 的 机 
会 ， 从 而 使 得 优良 特性 得 以 遗传 ， 体 现 了 自然 界 中 适 者 生存 的 道理 。 选 择 的 作用 效果 能 提高 
群体 的 平均 适应 度 函 数值 ， 因 为 通过 选择 操作 ， 低 适应 度 函 数值 个 体 趋向 于 被 淘汰 ， 而 高 适 
应 度 函 数值 个 体 趋向 于 被 复制 ， 因 而 在 选择 操作 中 群体 的 这 些 改进 具有 代表 性 ,但 这 是 以 损 
失 和 群体 的 多 样 性 为 代价 的 。 虽 然 选 择 操作 能 提高 群体 的 平均 适应 度 函 数值 ， 但 它 并 没有 产生 
新 的 个 体 ， 当 然 群 体 中 最 好 个 体 的 适应 度 函 数值 也 不 会 改进 。 

下 面 介绍 几 种 党 用 的 选择 方法 : 

(1) 适应 值 比例 选择 

适应 值 比例 选择 是 最 基本 的 选择 方法 ， 其 中 每 个 个 体 被 选择 的 期 望 数量 与 其 适应 值 和 群 
体 平均 适应 值 的 比例 有 关 ， 通 常 采 用 轮 盘 赌 〈(Roulette wheel) 方式 实现 。 这 种 方式 首先 计算 
每 个 个 体 的 适应 值 ， 然 后 计算 出 此 适应 值 在 群体 适应 值 总 和 中 所 占 的 比例 ， 表 示 该 个 体 在 选 
择 过 程 中 被 选中 的 概率 。 选 择 过 程 体现 了 生物 进化 过 程 中 “ 适 者 生存 ， 优 胜 劣 汰 ”的 思想 ， 
并 且 保证 优良 基因 遗传 给 下 一 代 个 体 。 

对 于 给 定 的 规模 为 的 群体 P= 14 ，w，…，wm 上 | ,个 体 aeP 的 适应 值 为 / (o) ,其 
选择 概率 为 
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Se 
让 会 汪 
该 式 决定 后 代 种 群 中 个 体 的 概率 分 布 。 经 过 选择 操作 生成 用 于 繁殖 的 交配 池 ， 其 中 父 代 
种 群 中 个 体 生存 的 期 望 数目 为 





ps( Qj) = j=1,2,°,n 











pla)=n: pa) J=1,2,.…,n 
当 群 体 中 个 体 适应 值 的 差异 非常 大 时 ， 最 佳 个 体 与 最 差 个 体 被 选择 的 概率 之 比 (选择 
压力 ) 也 将 按 指 数 增长 。 最 佳 个 体 在 下 一 代 的 生存 机 会 将 显著 增加 ， 而 最 差 个 体 的 生存 机 
会 将 被 剥夺 。 然 而 ， 这 种 方法 亦 会 使 当前 群体 中 的 最 佳 个 体 快速 充满 整个 群体 ， 导 致 群体 的 
多 样 性 迅速 降低 ，GA 也 就 过 早 地 丧失 了 进化 能 力 。 这 是 适应 值 比例 选择 容易 出 现 的 问题 。 
(2) Boltzmann 选择 


在 群体 进化 过 程 中 ,不 同 阶段 需要 不 同 的 选择 压力 。 早 期 阶段 选择 压力 较 小 ， 我 们 和 希望 
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较 差 的 个 体 也 有 一 定 的 生存 机 会 ， 使 得 群体 保持 较 高 的 多 样 性 ， 后 期 阶段 选择 压力 较 大 ， 我 
们 希望 CA 缩小 搜索 邻 域 ， 加 快 当前 最 优 解 改 善 的 速度 。 为 了 动态 调整 群体 进化 过 程 中 的 先 
择 压 力 ，Goldberg 设计 了 Boltzmann 选择 方法 。 个 体 选择 概率 为 
(a) /7 
Pai) = 。 j=1,2,.…,n 
y ww 
i=1 

其 中 ，7>0 是 退火 温度 。7 随 着 迭代 的 进行 逐渐 缩小 ， 选 择 压力 将 随 之 升 高 。Goldberg 
通过 一 组 试验 分 析 ， 认 为 该 选择 方法 显然 好 于 适应 值 比例 选择 。7 是 控制 群体 进化 过 程 中 选 
择 压 力 的 关键 ， 一 般 了 的 选择 需要 考虑 预计 最 大 进化 代数 。 

(3) 排序 选择 

排序 选择 方式 是 将 群体 中 个 体 按 其 适应 值 由 大 到 小 的 顺序 排 成 一 个 序列 ， 然 后 将 事先 设 
计 好 的 序列 概率 分 配给 每 个 个 体 。 显 然 ， 排 序 选 择 与 个 体 的 适应 值 的 绝对 值 无 直接 关系 ， 仅 
仅 与 个 体 之 间 的 适应 值 相对 大 小 有 关 。 排 序 选择 不 利用 个 体 适 应 值 绝对 值 的 信息 ， 可 以 避免 
群体 进化 过 程 的 适应 值 标 度 变换 。 由 于 排序 选择 概率 比较 容易 控制 ， 所 以 在 实际 计算 过 程 中 
经 常 采 用 ， 特 别 适 用 于 动态 调整 选择 概率 ， 根据 进化 效果 适时 改变 群体 选择 压力 。 

最 常用 的 排序 选择 方法 是 采用 线性 函数 将 队列 序号 映射 为 期 望 的 选择 概率 ， 即 线性 排序 
选择 (Linear ranking selection) 。 

对 于 给 定 的 规模 为 n 的 群体 P= ja ，a,，…，a,| ， 并 满足 个 体 适 应 值 降序 排列 f(a ) 
三 f(a ) 三 … 宇 f(a,)。 假 设 当 前 群体 最 佳 个 体 a 在 选择 操作 后 的 期 望 数 量 为 n+， 即 y+ =nx 
p1; 最 差 的 个 体 a 在 选择 操作 后 的 期 望 数量 为 mn -， 即 m =nxp,,。 其 他 个 体 的 期 望 数量 按 等 


差 序列 计算 ，An= 久 -01 = ， 则 矶 = 从 -An (六 1) = 让 一》 (j-1)， 故 线性 排 
序 的 选择 概率 为 


























































































































1 + 大 
po)= [1 J- | a 


由 > m=n 可 以 导出 w*+w-=2。 要求 p,=0, 7 二 0 故 1<9*<2。 当 w=2, =0 时 ， 
je1 


即 最 差 个 体 在 下 一 代 生 存 的 期 望 数 量 为 0， 群 体 选择 压力 最 大 ; 当 m*=m =1 时 ， 选 择 方式 
为 按 均 匀 分 布 的 随机 选择 ， 群 体 选择 压力 最 小 。 

除了 上 面 介绍 的 几 种 方法 外 还 有 其 他 方法 ， 如 : 联赛 选择 、 精 英 选 择 、 稳 态 选 择 等 。 

交叉 (Crossover) 操作 主要 用 于 产生 新 的 个 体 ， 在 解 空 间 中 进行 有 效 搜索 ， 同 时 降低 对 
有 效 模 式 的 破坏 概率 。 二 进 制 编码 中 ， 单 点 交叉 随机 确定 一 个 交叉 位 置 ， 然 后 对 换 相 应 的 子 
串 ; 多 点 交叉 随机 确定 多 个 交叉 位 置 ， 然 后 对 换 相 应 的 子 串 。 在 组 合 优 化 中 ， 交叉 操作 可 分 
为 次 序 交 又 、 循 环 交 义 以 及 映射 交叉 等 。 

交叉 操作 一 般 分 为 以 下 几 个 步骤 ; 

Step1， 从 交配 池 中 随机 取出 要 交配 的 一 对 个 体 ; 

Step2， 根 据 位 串 长 度 工 ， 对 要 交配 的 一 对 个 体 ， 随 机 选取 [1，L-1] 中 一 个 或 多 个 的 
整数 天 作为 交叉 位 置 ; 

Step3 ， 根 据 交叉 概率 mm (0<p. 和 1) 实施 交叉 操作 ， 配 对 个 体 在 交叉 位 置 处 ， 相 互 交换 
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各 自 的 部 分 内 容 ， 从 而 形成 新 的 一 对 个 体 。 
通常 使 用 的 交叉 操作 包括 一 点 交叉 、 两 点 交叉 、 多 点 交叉 以 及 一 致 交 义 等 形式 。 
(1) 一 点 交叉 ( One-point crossover) 
一 点 交叉 是 由 Holland 提出 的 最 基础 的 一 种 交叉 方式 ， 如 图 9-6 所 示 。 对 于 从 交配 池 中 
ne 51 一 QI11012 CC CU1，32 一 021022 021021 “021， 随机 选择 一 个 交叉 位 
<e|11,2,……,7-11， 不妨 设 六 xz 生 六， 对 两 个 位 串 中 该 位 置 右 侧 部 分 的 染色 体位 串 进 行 交 
换 ， ee 














$51 三 Q11Q12 7Q11 020 021 

352 三 Q21022 0211 010 7Q11 
一 点 交叉 操作 的 信息 量 比较 小 ， 交 又 点 位 置 的 选择 可 能 带 来 较 大 偏差 (Positional bias ) 。 
按照 Holland 的 思想 ， 一 点 交叉 算 子 不 利于 长 距 模 式 的 保留 和 重组 ， 而 且 位 串 末 尾 的 重要 基 
因 总 是 被 交换 ( 尾 点 效应 ，End-point effect)， 故 实际 应 用 中 采用 较 多 的 是 两 点 交 义 (Two- 


point crossover ) 。 








父 代 个 体 子 代 个 体 


图 9-6 一 点 交叉 



































(2) 多 点 交叉 ( Multi-point crossover) 
为 了 增加 交叉 的 信息 量 ，GA 发 展 了 多 点 交叉 的 概念 。 对 于 选 定 的 两 个 个 体位 串 ， 随 机 
选择 多 个 交叉 点 ， 构 成 交叉 点 集合 ， 见 图 9-7。 
X1 0 Ee (1,2,,L-1) wx ,k=1,2,.…,K-1 









































父 代 个 体 子 代 个 体 
多 点 交叉 
图 9-7 多 点 交叉 


将 工 个 基因 位 划分 为 K+1 个 基因 位 集合 : 
OK= {lsd=1,, -1l} k=1,2,.,K-1 








算 子 形式 为 
Ge a ie 0,,k 为 偶数 
Ri 其 他 
,fa ie 0,,k 为 偶数 
则 生成 的 新 个 体 为 
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51 三 Qll1Q12…Q17 
5 =021022 "02 
多 点 交叉 算 子 的 交叉 点 数 和 位 置 的 选择 有 多 种 方法 。 对 于 实 参数 优 化 问题 采用 二 进 制 编 
码 ， 一 般 交 叉 点 的 数量 不 宜 低 于 实 参数 的 维 数 。Mitchel 建议 每 次 交叉 操作 时 ， 按 泊 松 
(Poisson) 分 布 确定 交叉 点 数 : 
p(x)= et,E(4)= D(x)=A=8(L)>0 
其 中 ，x 为 交叉 点 数 ， 其 均值 E(x) 和 方差 D(x) 为 位 串 长 度 的 函数 。 
(3) 一 致 交叉 ( Uniform crossover， 又 称 均 匀 交 叉 ) 
一 致 交叉 即 染 色 体 位 串 上 的 每 一 位 在 相同 概率 进行 随机 均匀 交叉 ， 如 图 9-8 所 示 。 一 臻 
交叉 算 子 生成 的 新 个 体 为 








s1=alldl2…Q11 
52 二 021022…Q21 
操作 描述 如 下 : 
x>1/2 
x1/2 
a %>1/2 
“=| x1/2 
x 是 取 值 为 [0，1] 上 符合 均匀 分 布 的 随机 变量 。 
Spears 和 De Jong 认为 一 致 交叉 算 子 优 于 多 点 交叉 算 子 ， 
并 提出 了 一 种 带 偏 置 概率 参数 的 一 致 交叉 (0.8 三 x 三 0.5) ， 杂交 模板 上 | 0 
不 存在 多 点 交叉 算 子 操作 引起 的 位 置 偏差 ， 任 意 基 因 位 的 重 
要 基因 在 一 致 交叉 作用 下 均 可 以 重组 ， 并 遗传 给 下 一 子 代 交代 个 体 
个 体 。 
从 第 i 代 群 体 的 交配 池 中 ， 任 意 选 择 两 个 个 体 进行 交叉 
操作 的 一 般 形式 表示 为 


Qs 
O(p,,%) : Ql1;= 
Ql1i 









































P(t)=c(P'(t) ,p.) 子 代 个 体 
针对 特定 问题 ,还 可 以 设计 其 他 类 型 的 交叉 算 子 。 而 加 而 呈 | | 
且 ， 对 于 不 同 的 编码 方式 ， 交 叉 算 子 也 不 同 ， 比 如 Messy CA 图 9-8 一 致 交叉 


中 的 交叉 算 子 、 基 于 树 形 结构 表示 的 染色 体位 串 的 交叉 、 
TSP 问题 中 的 部 分 匹配 交叉 (PMX) 、 顺 序 交叉 (OK) 、 周 期 交叉 (CX) 等 。 

变异 (Mutation) 操作 模拟 自然 界 生 物体 进化 中 染色 体 上 某 位 基因 发 生 的 突变 现象 ， 从 
而 改变 染色 体 的 结构 和 物理 性 状 。 在 遗传 算法 中 主要 用 于 避免 算法 的 早熟 收 伍 。 当 交叉 操作 
产生 的 后 代 适 应 值 不 再 进化 且 没 有 达到 最 优 时 ， 将 采用 变异 操作 来 克服 有 效 基因 的 缺损 ， 增 
加 种 群 的 多 样 性 。 实 数 编码 中 通常 采用 扰动 式 变异 ， 二 进 制 或 十 进 制 编码 中 通常 采用 其 换 式 
变异 。 

变异 算 子 通过 按 变 异 概率 p, 随机 反 转 菜 位 等 位 基因 的 二 进 制 字 符 值 来 实现 变异 操作 。 
对 于 给 定 的 染色 体位 串 ;| =a1a,…a,， 具 体 如 下 : 
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0 ( ) /7 1l-a; Xi pn 5 1 2 L| 
m» YX): 人 一 iE 一 , 
a， 其 他 


生成 新 的 个 体 s1=aia5…a;。 其 中 ,x; 是 对 应 于 每 一 个 基因 位 产生 的 均匀 随机 变量 ， 
ze [0，1]， 如 图 9-9 所 示 。 


变异 操作 作用 于 个 体位 串 的 等 位 基因 上 ， 由 于 变异 概率 比 
较 小 ， 在 实施 过 程 中 一 些 个 体 可 能 根本 不 发 生 一 次 变异 ， 造 成 下 
大 量 计算 资源 的 浪费 。 因 此 ， 在 GA 具体 应 用 中 ， 可 以 采用 一 
种 变通 措施 ， 首 先 判断 个 体 层次 的 变异 发 生 的 概率 ， 然 后 再 实 。 子 代 人 人 , 
施 基因 层次 上 的 变异 操作 。 一 般 包括 两 个 基本 步 又: 图 9-9 变异 
(1) 计算 个 体 发 生变 异 的 概率 
以 原始 的 变异 概率 bp, 为 基础 ， 可 以 计算 出 群体 中 个 体 发 生变 异 的 概率 : 


pa(@)=1-(1-pn)” j=1,2,.,n 


给 定 均匀 随机 变量 [0，1] ， 若 *<mm(w) ， 则 对 该 个 体 进行 变异 ， 否 则 表示 不 发 生 
变异 。 

(2) 计算 发 生变 异 的 个 体 上 基因 变异 的 概率 

由 于 变异 操作 方式 发 生 了 改变 ， 被 选择 变异 的 个 体 上 基因 的 变异 概率 也 需要 相应 修改 ， 
以 保证 整个 群体 上 基因 发 生变 异 的 期 望 次 数 相等 。 传 统 变异 方式 下 整个 群体 基因 变异 的 期 望 
次 数 为 nxLxp,, ， 设 新 的 基因 变异 概率 为 p ， 新 的 变异 方式 下 整个 群体 基因 变异 的 期 望 次 数 
为 ; (nxpw(w) )x(Lxp')” 要求 两 者 相等 ， 即 

nxLxpa = (nxpa( 0) ) x( Lxp’,) 









































可 以 导出 : 
,nn 
mw ya) dlp 
ph>pmn， 位 串 越 短 ，p' 比 p,, 大 得 越 多 。 当 位 串 长 度 趋 于 无 穷 大 时 两 者 相等 ， 即 
limpm =pno 
传统 变异 方式 下 的 计算 量 为 nxL， 新 的 变异 方式 下 的 计算 量 为 nxp,,(a;) xL， 计 算 量 差 
异 为 nxLx(1-pi(a;) )， 显然 新 的 变异 方式 比 传统 方式 计算 量 降 低 了 ， 且 随 着 位 串 长 度 的 增 
大 而 下 降 。 但 是 ， 这 种 新 变异 方式 也 在 一 定 程度 上 偏离 了 原来 的 变异 基因 位 在 全 部 群体 个 体 
基因 位 中 的 均匀 分 布 的 情况 ， 当 群体 比较 小 时 ， 可 能 会 带 来 一 定 的 变异 误差 。 
5. 算法 终止 条 件 
根据 GA 以 概率 1 收敛 的 极限 性 质 ， 我 们 需要 通过 算法 操作 设计 和 参数 选择 来 提高 算法 
的 收敛 速度 。 在 实际 采用 GA 算法 来 求解 某 问题 时 ， 通 常设 定 一 定 的 算法 终止 条 件 来 避免 算 
法 无 停止 的 发 展 下 去 。 最 常用 的 终止 条 件 为 事先 给 定 一 个 最 大 进化 步 数 或 给 定 一 个 适应 值 最 
大 不 改进 进化 步 数 。 
应 该 清楚 地 看 到 ，GA 是 一 种 复杂 的 非 线性 智能 计算 模型 ， 通 过 数学 方法 来 预测 其 运算 
结果 是 很 难 达到 的 。 为 兼顾 GA 的 优化 效率 及 质量 ， 在 应 用 算法 时 许多 环节 通常 是 赁 经 验 解 
决 的 ， 因 而 这 方面 还 需要 人 们 更 深入 的 研究 。 
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9. 6.2 遗传 算法 中 的 基本 流程 


标准 的 遗传 算法 主要 步骤 如 下 : 

Step1， 随 机 产生 初始 种 群 ， 评 价 每 一 个 个 体 的 适应 值 。 

Step2， 判 断 是 否 满足 收敛 准则 ， 知 满足 则 输出 结果 ， 和 否则 继续 执行 以 下 步骤 。 

Step3， 根 据 适 应 值 大 小 执行 复制 操作 。 

Step4， 根 据 已 设 交 叉 概 率 (L,) 执行 交叉 操作 。 

Step5， 根 据 已 设 变异 概率 (L,,) 执行 变异 操作 。 

Step6， 返 回 Step2。 

算法 流程 图 如 图 9-10 所 示 。 

与 传统 优化 算法 相 比 ， 遗 传 算法 采用 生物 进化 和 遗传 的 思想 来 实现 优化 过 程 ， 具 有 以 下 
村 点 : 

1) GA 针对 问题 参数 编码 成 染色 体 后 进行 操作 ， 因 而 不 受 约束 条 件 的 限制 ， 例 如 连续 
性 、 可 导 性 等 。 

2) GA 搜索 过 程 不 是 从 一 个 个 体 开 始 ， 而 是 从 问题 解 的 一 个 集合 开始 ， 具 有 隐 含 并 行 
搜索 特性 ， 从 而 在 很 大 程度 上 降低 了 陷入 局 部 最 优 的 可 能 性 。 

3) GA 使 用 的 操作 均 是 随机 操作 ， 只 依赖 于 个 体 的 适应 值 信息 。 

4) GA 具有 全 局 搜索 能 力 ， 可 以 有 效 求解 非 线性 复杂 问题 。 
























产生 初始 种 群 
并 计算 适应 值 











是 否 满足 算法 收敛 准则 


N 
执行 复制 操作 


random[0,1]< Ze ? 
等 


执行 交叉 操作 
嘱 
执行 变异 操作 


图 9-10 标准 遗传 算法 流程 图 














9. 6. 3 遗传 算法 的 改进 


自从 Holland 出 版 了 第 一 本 系统 论述 遗传 算法 和 人 工 自 适应 系统 的 专著 《自然 系统 和 人 
工 系统 的 自 适 应 性 (Adaptation in Natural and Artificial Systems ) 》 后 ， 至 今 各 国学 者 已 对 遗 
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传 算法 进行 了 各 方面 的 改进 工作 。 从 已 有 的 工作 中 可 以 看 出 ， 大 都 在 基因 操作 、 种 群 的 宏观 
操作 以 及 算法 结构 上 做 进一步 的 改进 ， 其 主要 思想 是 为 了 提高 算法 的 效率 并 避免 出 现 早 熟 收 
敛 现 象 。 

目前 ， 除 了 表 9-1 中 针对 交叉 操作 的 改进 外 ， 常 用 的 交叉 算 子 还 有 置换 交叉 、 局 发 式 交 
又 以 及 算术 交叉 等 。 





表 9-1 针对 交叉 操作 的 改进 























年 代 学 者 对 交叉 操作 的 改进 
1975 Dejong 单 点 交叉 ( One-point crossover) 和 多 点 交叉 
1985 Smith 循环 交叉 ( Cycle crossover) 
1989 Goldberg 部 分 匹配 交叉 (Partially mapped crossover) 
Syswerda 双 点 交叉 ( Two-point crossover) 
1991 Starkweather 加 强 弧 重组 ( Enhanced edge recombination ) 
Davis 序号 交叉 ( Order crossover) 和 均匀 排序 交叉 ( Uniform order-based crossover) 








针对 复制 操作 ，Dejong 于 1975 年 设计 了 回放 式 随机 采样 复制 ， 由 于 存在 选择 误差 大 的 
缺点 ， 又 设计 了 选择 误差 较 小 的 无 回放 式 随 机 采样 复制 。Brindle 于 1981 年 又 在 前 人 对 复制 
操作 研究 的 基础 上 设计 了 确定 式 采 样 以 及 无 回放 式 余 数 随 机 采样 方法 ， 进 一 步 降 低 了 选择 误 
差 。Back 在 1992 年 针对 求解 线性 问题 提出 了 全 局 收敛 的 最 优 串 复 制 策略 和 均匀 排序 策略 。 

针对 变异 操作 ， 学 者 们 主要 研究 了 自 适 应 变异 以 及 多 级 变异 等 操作 ， 同 时 针对 基因 操作 
也 进行 了 进一步 的 改进 。 例 如 ,设计 了 倒 位 操作 用 于 增加 有 用 基因 块 的 紧密 形式 ; 优先 策略 
用 于 将 当前 解 集中 的 最 好 解 直 接 移入 下 一 代 种 群 中 以 保证 每 代 种 群 中 都 有 当前 最 好 解 ， 显 性 
遗传 策略 用 于 增加 曾经 适应 值 好 而 当前 比较 差 的 基因 寿命 ， 并 在 变异 率 比 较 低 的 情况 下 能 
持 一 定 的 多 样 性 ;静态 繁殖 策略 用 部 分 优秀 子 串 来 代 蔡 部 分 父 串 并 作为 下 一 代 种 群 ， 保 留 优 
秀 的 父 串 。 除 此 之 外 ， 还 有 分 离 、 异 位 、 多 倍 体 结构 等 基因 操作 。 针 对 GA 结构 方面 的 改进 
在 表 9-2 中 给 出 。 

从 20 世纪 80 年 代 中 期 开始 ， 针 对 遗传 算法 的 研究 达到 了 一 个 高 潮 ， 以 遗传 算法 为 主题 
的 国际 会 议 在 世界 各 地 定期 召开 。1985 年 第 一 届 国 际 遗 传 算法 会 议 (International conference 
on genetic algorithms, ICGA) 在 美国 卡耐基 梅 隆 大 学 召开 ， 以 后 每 两 年 召开 一 届 ， 与 遗传 算 
法 相关 的 会 议 还 有 很 多 。 


















































表 9-2 遗传 算法 结构 的 改进 





















































年 代 学 者 算法 结构 改进 点 
设计 多 种 并 行 结构 ,如 同步 主 - 仆 方法 ` 亚 同步 主 - 仆 方法 、 分 布 式 异 步 并 发 方法 、 
981 Grefenstette 2 
网 络 方法 

1989 Krishnakumar 提出 mGA 小 群体 方法 

Goldberg 提出 基于 对 象 设计 GA 并 行 结构 思想 
1991 Androulakis 提出 扩展 遗传 搜索 方法 

Muhlenbein 采用 并 行 遗 传 算法 求解 高 维 多 极 小 函数 的 全 局 最 小 解 

1992 Schraudolph 提出 参数 动态 编码 策略 
1994 Poths 提出 基于 变迁 和 人 工 选择 的 遗传 算法 
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9. 6. 4 遗传 算法 的 实现 


装 箱 问题 (Bin Packing) 为 一 类 典型 的 组 合 优化 问题 ， 从 计算 复杂 性 理论 来 讲 ， 装 箱 
问题 是 一 个 NP 完全 问题 ， 很 难 精确 求解 。 本 节 以 装 箱 问题 为 例 介绍 遗传 算法 的 实现 方案 。 
站 





装 箱 问 题 可 以 定义 如 下 : n 个 物品 pl，p，，…， Pp， 和 需要 装 箱 ， 每 个 物品 的 体积 为 
gq(p;) e (0,1]， 其 中 i=1，2,，…, n。 设 每 个 箱子 的 容积 为 1， 如 何 装载 n 个 物品 使 所 用 的 
箱子 数量 最 少 。 

1. 编码 


假设 1 个 箱子 的 编号 分 别 为 Kl ，K,，…K, (1<n)。 这 里 ， 多 个 物品 可 以 装 入 同一 个 箱 
子 ， 所 以 各 个 物品 疡 所 装 和 人 箱子 的 编号 顺序 排列 可 以 构成 该 问题 的 染色 体 编码 ， 例 如 : K， 
KsK,……K3KsK, 表 示 一 个 装 箱 方案 ， 其 中 第 一 个 物品 装 K 箱 子 ， 第 2 个 和 第 n-1 个 物品 装 
KK 箱子 ,第 3 个 和 第 n 个 物品 装 K, 箱 子 。 初 始 种 群 可 以 由 箱子 编号 的 随机 排列 得 到 。 

2. 目标 函数 以 及 适应 度 函 数 

设 m 为 装载 方案 中 使 用 箱子 的 数量 ，K(p;) 为 物品 疡 所 装 箱子 号 ， 则 该 装 箱 问题 的 目 
标 函 数 如 下 : 





m 


fir)=mx(m- Do)=mxim- SE > gp) -Bxmax(0, 2 gq(p;) -1)]) 
天 1 0 


j=1 K(p;) = 及 K(p;) =K. 


其 中 ,cj 为 kK 箱子 所 六 物品 体积 和 ,Bp 为 箱子 所 装 物 品 体积 超出 箱子 容积 的 惩罚 
系数 。 
在 该 目标 函数 中 ， 既 考虑 了 所 使 用 箱子 数量 最 少 又 考虑 了 每 个 箱子 剩余 容积 尽 可 能 的 
小 。 通 过 目标 函数 我 们 可 以 容易 获得 该 问题 的 适应 度 函 数 ， 即 
py NA) A <M 
0 f(x)=M 
其 中 1 为 一 足够 大 正 数 以 此 保证 适应 度 函 数 所 获得 的 值 为 非 负 值 。 
3. 遗传 算 子 
选用 通用 的 一 些 遗 传 操作 算 子 ， 如 : 选择 算 子 采用 比例 选择 算 子 ; 交叉 算 子 采用 单 点 交 
叉 算 子 ; 变异 算 子 采用 编码 字符 集 Y= | Ki ,K,,…,Ki| 范围 内 的 均匀 随机 变异 。 
上 述 求解 装 箱 问 题 的 简单 遗传 算法 的 缺点 是 : 初始 群体 和 进化 过 程 中 可 能 会 产生 一 些 无 
效 染 色 体 ， 这 些 无 效 染 色 体 所 表示 的 装 箱 方案 中 ， 某 一 箱子 所 装 物品 的 体积 之 和 超过 箱子 的 
规定 容量 ， 从 而 使 得 运算 效率 降低 ， 也 会 导致 得 不 到 好 的 运算 结果 。 一 般 可 以 通过 与 其 他 算 
法 混合 的 方法 来 提高 算法 的 运行 效率 和 解 的 质量 。 
【 例 9-1 】 用 遗传 算法 求解 一 元 函数 f(x) =xsin(10m . x+2.0)xe[—-1,2] 的 最 大 值 ， 求 
解 精度 要 求 精确 到 6 位 小 数 。 
对 方程 的 解 x 进行 编码 ， 采 用 二 进 制 编码 形式 。 首 先 计算 区 间 长 度 为 2-(-1)= 3， 则 可 
以 将 区 间 [-1, 2] 分 为 3x105 等 份 。 由 于 22 <3x106<22 ， 所 以 二 进 制 编码 的 长 度 至 少 需要 
22 位 。 二 进 制 编码 与 区 间 内 对 应 的 实数 之 间 的 关系 如 下 : 





























1 
(bab20rbo) 2s = (PD bi 2:) = (9-4) 
i=0 
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x=—1.0+x’ 





(9-5) 


由 于 要 求 函数 的 最 大 值 ， 且 函数 在 定义 域内 的 函数 值 大 于 0， 因此 可 以 直接 使 用 目标 


函数 作为 遗传 算法 的 适应 函数 。 遗 传 操作 使 用 轮 盘 赌 的 方式 选 
80， 最 大 迭代 次 数 为 100， 














交叉 概率 为 0. 3 ， 





先 择 子 代 个 体 。 初 始 种 群 为 





变异 概率 为 0. 05。 遗 传 算法 的 部 分 寻 优 过 程 
如 表 9-3 所 示 ， 在 运行 到 第 96 代 时 找到 了 最 优 个 体 ， 其 对 应 的 解 与 微分 方程 计算 的 最 优 





消 数 的 M 文件 ， 并 且 将 该 文件 保存 为 afun. m。 





function y=afun(x 


i x<=2 & x>=-1 


y =-—(x* sin(10* pi* x)+2.0); 


else 
y=0; 
end 
利用 遗传 算法 工具 箱 进 行 计算 ,在 matlab 命 
>> gatool 


) 








函数 编写 内 容 为 : 


% 转 化 为 最 小 化 问题 


令 窗 输入 


则 遗传 算法 的 GUI 被 打开 ， 如 图 9-11 所 示 。 
图 9-11 中 ， 各 选项 的 含义 为 : 


Solver 中 选择 





需要 使 用 的 算法 ， 本 例 中 选 


Problem 描述 需要 解决 的 问题 . 


1) Fitness function: 








先 择 默认 的 ga-Genetic Algorithm 。 





即 为 编写 目标 函数 的 M 文件 ， 本 例 中 ， 在 Fitness function 窗口 输入 @ afun。 


2) Number of variables : 


输入 变量 数目 为 1。 


Constraints ( 约 束 ) : 


1) Linear inequalities: 
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线性 不 等 式 约束 。 


解 相 吻合 
表 9-3 ”遗传 算法 部 分 寻 优 过 程 及 最 优 个 体 演变 情况 
迁 代 次 数 个 体 的 二 进 制 编码 函数 最 大 值 (适应 值 ) x 

1 1111001010100111101100 1. 843 614 3. 806 640 

汉 1111001010101111101100 1. 843 981 3. 811 107 

6 1111001110010110001100 1. 854 532 3. 835 767 

7 1111001101010111010100 1. 851 654 3. 849 155 

11 1111001101000110100100 1. 850 887 3. 850 168 

25 1111001101000110100100 1. 850 887 3. 850 168 

36 1111001101000110100100 1. 850 887 3. 850 168 

52 1111001100111001001001 1. 850 273 3. 850 205 

54 1111001100111101001001 1. 850 456 3. 850 266 

91 1111001100111101110100 1. 850 486 3. 850 270 

96 1111001100111111010000 1. 850 562 3. 850 274 

100 1111001100111111010000 1. 850 562 3. 850 274 
、 y 十 Ni = 和 下 | 大 二 
遗传 算法 可 借助 Matlab 的 工具 箱 进行 实现 。 以 【 例 9-1】 中 的 函数 优化 为 例 ， 编 写 目 标 


需要 优化 的 目标 函数 ， 填 写 格式 为 : @ funname， 其 中 fonname. m 


目标 孔 数 输入 变量 的 数目 。 本 例 中 ， 在 Number of variables 窗口 
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Solver: |ga - Genetic Algorithm 
Problem | 
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图 9-11 工具 箱 界 面 





2) Linear equalities: 线性 等 式 约束 。 

3) Bounds: 填写 独立 变量 的 取 值 范 围 。 

4) Nonlinear constraint function: 非 线性 约束 函数 。 

Run solver and view results: 运行 求解 右 并 观察 结果 。 

单 击 Start 即 可 开始 运行 遗传 算法 。Current iteration 中 将 显示 当前 运行 的 代数 ，Final 
point 栏 中 显示 最 优 解 对 应 的 变量 取 值 。 

Option 用 于 设 定 遗 传 算法 的 参数 。 

Population 种 群 参数 设 定 : 

1) Population type: 编码 方式 选择 ， 可 选 浮 点 编码 或 二 进 制 编码 。 

2) Population size: 种 群 大 小 参数 设 定 。 

3) Creation function : 创建 初始 种 群 函数 。 

4) Initial population: 初始 种 群 ， 如 果 不 指 定 初始 种 群 ， 则 系统 利用 创建 函数 来 创建 初 
始 种 群 。 

5) Initial scores 初始 得 分 ， 如 果 未 定义 ， 则 系统 利用 适应 度 函 数 来 计算 初始 得 分 。 

6) Initial range: 初始 范围 ， 用 于 指定 初始 种 群 中 各 变量 的 上 下 限 。 

7) Fitness scaling: 变换 适应 度 函 数值 的 函数 句柄 。 

8) Elite count: 直接 保留 上 一 代 的 个 体 数 。 

9) Crossover fraction: 交叉 概率 。 

10) Migration: 指定 迁移 方向 、 概 率 和 频率 。 

11) Stopping criteria: 指定 结束 条 件 。 

12) Plot functions: 图 形 输出 选项 。 例 如 ， 选 中 Best fitness 和 Best individual 两 个 选项 ， 
单 击 Start， 得 到 运行 结果 如 图 9-12 所 示 。 
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9.7 蚁 群 算法 


有 蚁 群 算法 是 受 自然 界 中 真实 蚊 群 的 集体 砚 食 行为 的 启发 而 发 展 起 来 的 一 种 基于 群集 智能 
的 进化 算法 ， 属 于 随机 搜索 算法 ， 它 是 由 意大利 学 者 Dorigo 等 人 在 20 世纪 90 年 代 初 首先 提 
出 来 的 。 虽 然 蚂蚁 本 身 的 行为 极其 简单 ， 但 由 这 些 简单 个 体 所 组 成 的 蚁 群 却 表 现 出 极其 复 厅 
的 行为 特征 。 如 蚁 群 除 了 能 够 找到 蚁 梨 与 食物 源 之 间 的 最 短路 径 外 ， 还 能 适应 环境 的 变化 ， 
即 在 蚁 群 运 动 的 路 线 上 突然 出 现 障 碍 物 时 ， 蚂 蚁 能 够 很 快 地 重新 找到 最 短路 径 。 

仿生 学 家 经 过 大 量 的 观察 、 研 究 发 现 ， 蚂 蚁 在 寻找 食物 时 ， 能 在 其 经 过 的 路 径 上 释放 一 
种 蚂蚁 特有 的 分 废物 一 一 外 激素 (Pheromone ) ， 使 得 一 定 范围 内 的 其 他 蚂蚁 能 够 感觉 到 这 
种 物质 ， 且 倾向 于 朝 着 该 物质 强度 高 的 方向 移动 。 因 此 ， 蚁 群 的 集体 行为 表现 为 一 种 信息 正 
反馈 现象 : 基 条 路 径 上 经 过 的 蚂蚁 数 越 多 ， 其 上 留 下 的 外 激素 的 痕迹 也 就 越 多 ， 后 来 蚂蚁 选 
择 该 路 径 的 概率 也 越 高 ， 从 而 更 增加 了 该 路 径 上 外 激素 的 强度 。 蚁 群 这 种 选择 路 径 的 过 程 被 
称 为 自 催化 行为 〈Autocatalytic behavior) ， 由 于 其 原理 是 一 种 正 反 馈 机 制 ， 因 此 也 可 将 蚁 群 
的 行为 理解 成 所 谓 的 增强 型 学 习 系 统 。 


9.7.1 凡 群 算法 的 研究 现状 


1991 年 ， 意 大 利 学 者 M. Dorigo 等 首次 提出 了 蚁 群 算法 求解 TSP 问题 ， 实 验 表 明 蚁 群 算 
法 具有 较 强 的 鲁 棒 性 和 发 现 较 好 解 的 能 力 ， 但 也 存在 收敛 速度 慢 、 易 出 现 停滞 现象 等 。 该 算 
法 的 问 志 引起 了 学 者 们 的 普遍 关注 ， 并 且 针 对 算法 的 缺点 提出 了 一 些 改进 的 蚁 群 算法 ( 见 
表 9-3) 。L. M. Gambardella，M. Dorigo 提出 了 Ant-Q 算法 ， 该 算法 用 伪 随 机 比例 状态 转移 规 
则 (Pseudo random proportional state transition rule) 替换 随机 比例 转移 规则 (Stochastic pro- 
portional choice rule) ， 从 而 使 Ant-Q 算法 在 构造 解 的 过 程 中 能 够 更 好 的 保持 知识 探索 与 知识 
利用 之 间 的 平衡 。 除 此 之 外 ,该 算法 中 还 引用 了 局 部 信息 素 更 新 机 制 和 全 局 信息 素 更 新 中 的 
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精英 策略 。Stutzle 和 Hoss 还 提出 了 最 大 一 最 小 蚂蚁 系统 (MAX-MIN Ant System) ， 该 算法 的 
主要 特点 就 是 为 信息 素 设 置 上 下 限 来 避免 算法 过 早出 现 停 汪 现象 。Bullnheimer 等 提出 了 基 
于 排序 的 蚂蚁 系统 (Rank-based Version of Ant System ) ， 该 算法 在 完成 一 次 迭代 后 ， 将 蚂蚁 
所 经 路 径 的 长 度 按 从 小 到 大 的 顺序 排列 ， 并 根据 路 径 长 度 赋予 不 同 的 权重 ， 路 径 较 短 的 权重 
加 大 。 鉴 于 蚂蚁 系统 搜索 效率 低 和 质量 差 的 缺点 ，0. Cordon 提出 了 最 优 一 最 差 蚂 蚁 系统 
( Best-Worst Ant System) ， 该 算法 的 主要 思想 就 是 对 最 优 解 进行 更 大 限度 的 增强 ， 而 对 最 差 
解 进 行 削弱 ， 使 得 属于 最 优 路 径 边 与 属于 最 差 路 径 边 之 间 的 信息 素 量 差 异 进一步 增 大 ， 从 而 
使 蚂蚁 的 搜索 行为 更 集中 于 最 优 解 的 附近 。 

除了 各 种 组 合 优化 问题 外 ， 疏 群 算法 还 在 函数 优化 、 系 统 辨 识 、 机 器 人 路 径 规划 、 数 据 
挖掘 、 大 规模 集成 电路 的 综合 布线 设计 等 领域 取得 了 令 人 瞩目 的 成 果 。 蚁 群 算法 的 发 展 及 应 
用 及 表 9-4。 























表 9-4 改 群 算法 的 发 展 及 应 用 














研究 问题 作者 算法 改进 年 份 
Bullnheimer, Hartl&Strauss AS-VRP 1999 

车 辆 路 径 问 题 Gambadella, Taillard&Agazzi HAS-VRP 1999 
Reimann, Stummer&Doerner SBAS-VRP 2002 

Maniezzo, Colorni&Dorigo AS-QAP 1994 

Gambardella ,Taillard&Dorigo HAS-QAP 1997 

指派 问题 Stoble ，Hoos | MMAS-QAP 1997 
Maniezzo, Colorni AS-QAP 1999 

Maniezzo ANTS-QAP 1999 

Stutzle, Hoos MMAS-QAP 2000 

Dorigo, Maniezzo&Colorni AS 1991 

旅行 商 问题 Sombiena ，Dorigo ANT-Q 1995 
Dorigo, Gambardella ACS-3opt 1997 

Stutzle ，Hoos MMAS 1997 

Colorni, Dorigo&Maniezzo AS-JSP 1994 

调度 问题 Pfahringer AS-OSP 1996 
Stutzle AS-FSP 1997 











9.7.2 基本 蚁 群 算 法 的 工作 原理 


蚁 群 算法 是 一 种 基于 群体 的 、 用 于 求解 复杂 优化 问题 的 通用 搜索 技术 。 与 真实 蚂蚁 的 间 
接 通 信 相 类 似 ， 蚁 群 算法 中 一 群 简单 的 蚂蚁 (主体 ) 通过 信息 素 (一 种 分 布 式 的 数字 信息 ， 
与 真实 蚂蚁 的 外 激素 相对 应 ) 进行 间接 通信 ， 并 利用 该 信息 和 与 问题 相关 的 启发 式 信息 逐 
步 构造 问题 的 解 。 

所 谓 基 本 蚁 群 算法 ， 指 的 是 经 典 的 ACS (Ant Colony System) 算法 ， 它 具有 当前 很 多 种 
类 的 蚁 群 算法 最 基本 的 共同 特征 ， 后 来 一 系列 的 改进 蚁 群 算法 都 以 此 为 基础 。 

下 面 针 对 旅行 商 问 题 (TSP) 来 说 明 蚁 群 算法 的 工作 原理 。 蚂 蚁 不 断 地 选择 新 的 节点 到 
其 路 径 中 ， 直 到 其 遍历 了 所 有 的 节点 并 返回 到 初始 点 为 止 ， 我们 则 认为 这 只 蚂蚁 构造 了 一 个 
解决 方案 。 蚂 蚁 在 移动 时 不 是 盲目 的 ， 它 是 根据 转移 规则 ， 也 就 是 每 条 可 行 的 路 径 上 残留 的 
言 息 素 和 启发 式 信 息 (两 点 间 的 距离 ) 来 选择 下 一 节点 。 这 样 ， 蚂 蚁 在 节点 i 选择 节点 j 
的 转移 概率 如 下 : 
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- J € allowed,; 
p(k) 三 > 1 


he allowed, 
0 其 他 
其 中 ,zi 为 (i, 7) 边 的 信息 素 强度 ,反映 蚁 群 在 这 条 边 上 先 验 的 经 验 ， 是 蚁 群 在 寻 优 
过 程 中 所 积累 的 信息 量 ; wj 为 (i, 7) 边 的 能 见 度 ， 它 只 考虑 边 上 的 本 地 信息 ,通常 由 一 
个 与 源 问题 相关 的 贪 焚 算 法 得 到 ， 它 反映 的 是 蚂蚁 在 运动 过 程 中 的 启发 信息 ， 例 如 长 度 
等 ; a 是 信息 启发 式 因 子 ， 它 的 大 小 反映 了 蚁 群 在 路 径 搜 索 中 随机 性 因素 作用 的 强度 ， 其 
值 越 大 ， 蚂 蚁 选择 以 前 走 过 的 路 径 的 可 能 性 越 大 ， 搜 索 的 随机 性 减弱 ， 当 a 值 过 大 就 会 
使 蚁 群 的 搜索 过 早 陷于 局 部 最 优 ; B 是 能 见 度 启 发 式 因子 ， 它 的 大 小 则 反映 了 蚁 群 在 路 径 
搜索 中 确定 性 因素 作用 的 强度 ， 其 值 越 大 ， 蚂 蚁 在 某 个 局 部 点 上 选择 局 部 最 短路 径 的 可 
能 性 武大， 虽然 搜索 的 收 和 敛 速度 得 以 加 快 ， 但 疏 群 在 最 优 路 径 的 搜索 过 程 中 随机 性 减弱 ， 
也 易于 陷入 局 部 最 优 。 
蚁 群 算法 的 全 局 寻 优 性 能 ， 首 先 要 求 蚁 群 的 搜索 过 程 必 须 有 很 强 的 随机 性 ;而 上 蚁 群 算法 
的 快速 收敛 性 能 ， 又 要 求 蚁 群 的 搜索 过 程 必 须要 有 较 高 的 确定 性 。 两 者 对 蚁 群 算法 性 能 的 影 
响 和 作用 是 相互 配合 、 密 切 相 关 的 。 
为 了 对 后 续 的 搜索 提供 有 效 的 信息 ， 先 前 蚂 败 在 其 所 经 过 的 路 径 上 留 下 的 信息 素 痕迹 必 
须 能 够 反映 其 找到 路 径 的 优 劣 程度 。 当 所 有 蚂蚁 完成 一 次 周游 以 后 ， 各 路 径 上 的 信息 素 根 据 
下 式 更 新 















































TT =p XT) 十 > A 太 
y 万 


i 

其 中 ,7;* 表 示 蚂 蚁 在 本 次 循环 中 留 在 路 径 上 的 信息 量 , p 为 信息 素 残留 系数 ， 且 满足 
0<p<1。 

在 现实 的 蚁 群 系统 中 ， 较 短路 径 上 的 信息 素 浓度 更 高 ， 同 样 地 ， 在 蚁 群 算法 中 ， 越 好 的 
方案 中 的 路 径 应 获得 越 多 的 信息 素 增 量 ,使 其 在 后 续 的 搜索 中 更 具有 吸引 力 。 因 此 算法 中 采 
用 何 种 策略 更 新 信息 素 增 量 是 非常 重要 的 。M. Dorigo 给 出 三 种 不 同 的 更 新 策略 方法 ， 即 ant- 
cycle, ant-density, ant-quantity。 


(1) Ant-density 




















i_|Q ”蚂蚁 经 过 边 (i,j) 
4 其 他 
(2) Ant-quantity 
:_ {Qf 蚂蚁 经 过 边 (i,7) 
r={ 其 他 = 
(3) Ant-cycle 
:_ {Qf 蚂蚁 经 过 边 (i, 让 
和 -| 其 人 (3 


在 式 (9-6) ~ 式 (9-8) 中 ，@ 为 一 正 的 常数 ，f 表示 蚂蚁 经 过 边 (i, j) 的 目标 函数 
值 ， 太 表示 蚂蚁 记 经 过 整个 路 径 的 目标 函数 值 。 以 上 三 种 模型 的 区 别 在 于 : 前 两 种 策略 中 蚂 
蚁 每 走 一 步 都 要 更 新 残留 的 信息 量 ， 而 不 是 等 到 所 有 的 蚂蚁 完成 对 所 有 的 城市 访问 以 后 。 最 
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一 种 模型 利用 的 是 蚁 群 的 整体 信息 ， 即 走 完 一 个 循环 以 后 才 进 行 残留 信息 量 的 全 局 调整 

由 以 上 我 们 可 以 得 到 基本 蚁 群 算法 A : 

Step1， 参 数 初始 化 。 令 时 间 :=0， 循 环 次 数 fier=0， 最 大 循环 次 数 Max_ lier, 将 m 只 
蚂蚁 置 于 nn 个 点 上 ， 每 条 边 的 信息 量 7; 为 常数 ， 且 初始 时 刻 Ar;y =0。 

Step2， 循 环 次 数 Iter= Jter+1。 

Step3， 蚂 蚁 禁忌 表 索 引号 5=1。 

Step4， 蚂 蚁 数目 =k+1。 

Step5， 蚂 天 个 体 根 据 转移 概率 公式 计算 的 概率 选择 元 素 )， 且 满足 je | C-tabui|。 

Step6， 更 新 禁忌 表 ， 蚂 蚁 移动 到 新 点 ， 并 将 该 点 放置 到 该 蚂蚁 禁 忌 表 中 。 

Step7， 寿 集合 中 点 未 遍历 完 ， 转 Step4， 否 则 进行 下 一 步 。 

Step8， 根 据 信 息 素 更 新 公式 更 新 每 条 边 上 的 信息 量 。 

Step9 ， 若 liter=Max_ Jter, 算法 结束 ， 否则 清空 禁忌 表 并 转 Step2。 

从 中 我 们 可 以 看 出 蚁 群 算法 具有 如 下 特征 . 

(1) 系统 性 ”作为 系统 元 素 的 蚂蚁 是 相 异 的 个 体 ， 算 法 每 次 循环 它们 都 各 自 独 立 完成 
一 次 搜索 过 程 ， 体 现 了 系统 的 多 元 性 ; 蚂蚁 之 间 通 过 信息 素 相互 联系 、 传 递 经 验 进而 指导 搜 
索 的 行为 ， 体 现 了 系统 的 相关 性 ; 而 由 多 只 蚂蚁 组 成 的 蚊 群 的 搜索 性 能 明显 优 于 单 只 蚂蚁 ， 
也 反映 了 整体 大 于 部 分 之 和 这 一 系统 的 整体 性 。 

(2) 分 布 式 计算 ”多 只 蚂蚁 在 问题 空间 的 多 点 同时 独立 地 进行 搜索 ， 问 题 的 求解 不 会 
算法 不 仅 具 有 了 和 较 强 的 全 局 搜索 能 力 ， 也 增强 了 可 靠 性 。 
适合 于 单机 调度 问题 复杂 的 结构 图 。 

(3) 自 组 织 性 ”系统 论 中 的 自 组 织 行 为 是 指 系统 在 获得 时 间 的 、 空 间 的 或 者 功能 的 结 
构 过 程 中 没有 受到 外 界 的 特定 干扰 ， 其 组 织 力 或 组 织 指令 来 自 于 系统 内 部 。 抽 象 来 说 ， 自 组 
织 就 是 在 没有 外 界 作用 下 使 得 系统 焙 增 加 的 过 程 ， 也 就 是 系统 从 无 序 到 有 序 的 进化 过 程 。 蚁 
群 算法 的 寻 优 过 程 恰恰 体现 了 这 种 自 组 织 性 ， 而 自 组 织 性 也 大 大 增强 了 算法 的 鲁 棒 性 。 

(4) 正 反 馈 。 蚁 群 算法 是 通过 信息 素 的 不 断 更 新 来 实现 正 反 馈 的 ， 将 反映 当前 局 部 最 
优 解 特性 的 参数 作为 增 量 来 提高 这 些 解 的 构成 元 素 上 的 信息 素 浓度 ， 使 得 更 多 的 蚂蚁 有 机 会 
选择 这 些 元 素 去 构建 更 好 的 解 。 便 于 利用 问题 的 启发 信息 更 快 找到 更 优 的 解 。 


9.8 粒子 群 算法 及 应 用 







































































粒子 群 优化 (Particle Swarm Optimization ，PSO) 算法 是 由 Kennedy 和 Eberhart 于 1995 
年 提出 的 一 种 优化 算法 。PSO 算法 的 运行 机 理 不 是 依靠 个 体 的 自然 进化 规律 ， 而 是 对 生物 
群体 的 社会 行为 进行 模拟 ， 它 最 早 源 于 对 乌 群 砚 食 行为 的 研究 。 在 生物 群体 中 存在 着 个 体 与 
个 体 、 个 体 与 群体 间 的 相互 作用 、 相 互 影响 的 行为 ， 这 种 行为 体现 的 是 一 种 存在 于 生物 群体 
中 的 信息 共享 的 机 制 。PSO 算法 就 是 对 这 种 社会 行为 的 模拟 ， 即 利用 信息 共享 机 制 ， 使 得 
个 体 间 可 以 相互 借鉴 经 验 ， 从 而 促进 整个 群体 的 发 展 。 
PSO 算法 和 遗传 算法 ( Genetic Algorithm, GA) 类 似 ， 也 是 一 种 基于 迭代 的 优化 工具 ， 
系统 初始 化 为 一 组 随机 解 ， 通 过 某 种 方式 迭代 寻找 最 优 解 。 但 PSO 没有 GA 的 “选择 ”、 
“交叉 ” “变异 ” 算 子 ， 编 码 方式 也 较 GA 简单 。 由 于 PSO 算法 容易 理解 、 易 于 实现 ， 所 以 
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PSO 算法 发 展 很 快 。 在 函数 优化 、 系 统 控制 、 神 经 网 络 训练 等 领域 得 到 广泛 应 用 。 目 前 已 
被 “国际 进化 计算 会 议 ” (IEEE International Conferences on Evolutionary Computation, CEC) 
列 为 一 个 讨论 的 专题 。 
9. 8. 1 基本 粒子 群 优化 算法 

自从 粒子 群 优化 算法 被 提出 以 来 ， 它 就 被 多 次 改进 和 应 用 。 大 多 数 对 基本 PSO 的 改进 
都 致力 于 提高 它 的 收敛 性 能 以 及 提升 种 群 的 多 样 性 。 因 此 在 本 节 当 中 将 首先 介绍 基本 粒子 群 
优化 算法 。 

1. 算法 原理 

粒子 群 优 化 算法 兼 有 进化 计算 和 群 智能 的 特点 。 起 初 Kennedy 和 Eberhart 只 是 设想 模拟 
鸟 群 欧 食 的 过 程 ， 但 后 来 发 现 PSO 是 一 种 很 好 的 优化 工具 。 与 其 他 进化 算法 相 类 似 ，PSO 
算法 也 是 通过 个 体 间 的 协作 与 竞争 ， 实 现 复杂 空间 中 最 优 解 的 搜索 。PSO 先生 成 初始 种 群 ， 
即 在 可 行 解 空间 中 随机 初始 化 一 群 粒子 ， 每 个 粒子 都 为 优化 问题 的 一 个 解 ， 并 由 目标 函数 为 
之 确定 一 个 适应 值 (fitness value)。 每 个 粒子 将 在 解 空间 中 运动 ， 并 由 一 个 速度 决定 其 方 问 
和 距离 。 通 常 粒子 将 追随 当前 的 最 优 粒 子 而 动 ， 并 经 逐 代 搜 索 最 后 得 到 最 优 解 。 在 每 一 代 
中 ， 粒 子 将 跟踪 两 个 极 值 ， 一 为 粒子 本 身 迄 今 找 到 的 最 优 解 pbest， 男 一 为 全 种 群 迄今 找到 
的 最 优 解 gbest。 

数学 描述 为 : 设 在 一 个 n 维 的 搜索 空间 中 ， 由 m 个 粒子 组 成 的 种 群 和 = | XX] ,… 六;,… 
X ,| ， 其 中 第 i 个 粒子 位 置 为 x,= (x ,x ,…%;,) '， 其 速度 为 v= (vw ,v2,…2;,)'。 它 的 个 体 
极 值 为 P,= (pi ,ps,…p;,) ， 种 群 的 全 局 极 值 为 P= (py,Ppp ,Pan)o 按 追 随 当前 最 优 粒 子 
的 原理 ， 粒 子 *; 将 按 式 (9-9) 、 式 〈9-10) 改变 速度 和 位 置 。 
vd Viatcri pia-%ia) tear2( Pga -rsa) (9-9) 

ol at (9-10) 

其 中 ,d=1，2,，…, nn,，i=1，2,…,m，m 为 种 群 规模 ,，% 为 当前 进化 代数 ，r| 和 7 
为 分 布 于 [0, 1] 之 间 的 随机 数 ， 这 两 个 参数 用 来 保持 群体 的 多 样 性 ; cl 和 c 为 加 速 常 数 
(acceleration constants ) ， 也 称 学 习 因 子 ， 通 过 它们 使 粒子 具有 自我 总 结 和 向 群体 中 优秀 个 体 
学 习 的 能 力 ， 从 而 向 自己 的 历史 最 优点 以 及 群体 内 历史 最 优点 靠近 。 这 两 个 参数 对 粒子 群 算 
法 的 收敛 起 的 作用 不 是 很 大 ， 但 如 果 适 当 调 整 这 两 个 参数 ， 可 以 减少 局 部 最 小 值 的 困扰 ， 当 
然 也 会 使 收敛 速度 变 快 。 此 外 ， 为 使 粒子 速度 不 致 过 大 ， 可 设 定 速度 上 限 Vi ， 即 当 式 
(9-9) Vig> Vax 时 ， 取 vg>Vias; 当 via<-Vax 时 ， Vid = Vox; 式 (9-9) 的 第 一 部 分 为 粒子 当 
前 速度 ; 第 二 部 分 为 “ 认 知 (cognition) ”部 分 ， 表示 粒子 自身 的 思考 ; 第 三 部 分 为 “ 社 
会 (social) ”部 分 ， 表示 粒子 间 的 信息 共享 与 相互 合作 。 式 (9-9) 描述 了 粒子 根据 它 上 
一 次 迭代 的 速度 、 它 当前 位 置 和 自身 最 好 经 验 与 群体 最 好 经 验 之 间 的 距离 来 更 新 速度 ， 然 后 
粒子 根据 式 (9-10) 飞 向 新 的 位 置 。 

2. 算法 流程 

粒子 群 算法 的 主要 流程 步骤 如 下 : 

Step1， 初 始 化 。 设 定 加 速 常 数 cj 和 ec: ， 闽 值 =， 最 大 进化 代数 K.， 将 当前 进化 代数 置 
为 k=1， 在 定义 空间 R" 中 随机 产生 m 个 粒子 x|，x,，…，x,,， 组 成 初始 种 群 人 (1) ; 随机 产 
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生 各 粒子 的 初始 速度 四 = (vi ,v2 ，… ,Vi )。 

Step2， 评 价 种群 X(1:) 。 计 算 每 个 粒子 在 每 一 维 空间 的 适应 值 。 

Step3， 比 较 粒 子 的 适应 值 和 自身 最 优 值 ppest。 如 果 当 前 值 比 pbes 更 优 ， 则 置 pbest 为 当 
前 值 ， 并 设 pbest 位 置 为 n 维 空 间 中 的 当前 位 置 。 

Step4， 比 较 粒 子 适应 值 与 种 群 最 优 值 。 如 果 当 前 值 比 gbest 更 优 ， 则 置 gbesi 为 当前 粒子 
的 矩阵 下 标 和 适应 值 。 

Step5， 按 式 (9-9) 和 式 (9-10) 更 新 粒子 的 位 移 方向 和 步 长 ， 产 生 新 种 群 X(Ci+1l)。 

Step6， 检 查 结束 条 件 ， 若 满足 ， 则 结束 寻 优 ; 否 
则 ,zw=t+1， 转 至 Step2。 结 束 条 件 为 寻 优 达 到 最 大 进化 
代数 K,,. ， 或 评价 值 小 于 给 定 精度 e。 

粒子 群 算法 流程 图 如 图 9-13 所 示 。 

3. 基本 粒子 群 优化 的 参数 

基本 粒子 群 优化 受 它 的 一 些 参 数 影响 ， 包 括 问题 的 
维 数 、 粒 子 的 个 数 、 加 速度 系数 、 惯 性 权重 、 邻 域 大 
小 、 和 迭代 次 数 等 。 下 面 讨 论 这 些 参 数 在 算法 中 的 作用 。 

(1) 种 群 大 小 

种 群 大 小 m， 即 群 中 粒子 的 个 数 ， 当 一 个 均匀 初始 
化 方案 被 应 用 到 种 群 的 初始 化 操作 时 ， 粒 子 个 数 越 多 ， Y 
种 群 的 初始 化 多 样 性 越 好 。 大 数量 粒子 的 种 群 可 在 每 一 
次 迭代 中 搜索 更 大 的 区 域 ， 然 而 这 也 同时 增 大 了 算法 的 。 图 9.13 和 粒子 群 算法 简化 流程 图 
计算 量 以 及 降低 了 并 行 随机 搜索 的 性 能 。 相 对 于 较 少 粒 
子 数 的 种 群 ， 大 数量 的 种 群 可 以 在 更 少 的 迭代 次 数 中 找到 问题 的 解 。 经 研究 表明 ，PSO 可 
以 用 10~30 个 粒子 的 种 群 来 找到 最 优化 问题 的 解 。 虽 然 有 上 述 经 验 性 的 结论 ， 如 何 确定 粒 
子 的 个 数 仍然 依赖 于 具体 要 解决 的 问题 。 搜 索 一 个 光滑 的 空间 中 的 最 优 值 比 在 粗 烟 的 空间 需 
要 更 少 的 粒子 数 。 

(2) 邻 域 大 小 

邻 域 大 小 定义 了 种 群 中 的 社会 影响 力 ， 邻 域 越 小 ， 交 流 越 少 。 较 大 的 邻 域 收 伊 较 慢 ， 不 
过 它 的 收敛 更 能 可 靠 的 找到 最 优 解 ， 同 时 它 也 不 容易 陷入 局 部 极 小 值 。 更 好 的 利用 邻 域 大 小 
的 方法 是 在 开始 时 设 定 较 小 的 邻 域 ， 然后 随 着 迭代 次 数 的 增加 逐渐 增 大 。 这 种 方法 既 保 证 了 
种 群 多 样 性 ， 同 时 也 有 更 快 的 收敛 速度 。 

(3) 迭代 次 数 

得 到 一 个 好 的 解 所 需要 的 迭代 次 数 也 是 依赖 于 具体 问题 的 。 太 小 的 迭代 次 数 可 能 使 得 算 
法 早熟 ， 而 太 大 的 迭代 次 数 会 增加 很 多 不 必要 的 计算 负担 (假设 一 定 的 迭代 次 数 作为 唯一 
的 停止 准则 ) 。 

(4) 加 速度 系数 

常数 cl 和 c 也 叫做 信任 度 参 数 ， 分 别 表示 粒子 对 自身 和 对 其 邻居 的 信任 程度 。 当 ci = 
c=0 时 ， 粒 子 将 会 在 其 现 有 速度 的 方向 上 持续 移动 ， 直 到 撞 到 搜索 边界 为 止 〈 假 设 没 有 惯 
性 ) 。 假 如 cj>0 且 cs =0， 所 有 粒子 就 是 独立 的 爬山 者 。 每 个 粒子 都 在 其 邻 域内 寻找 新 的 更 
好 的 最 优 位 置 以 替代 当前 的 最 优 位 置 ， 粒 子 进行 的 是 局 部 搜索 。 反 之 ， 如 果 cl =0 且 c>0， 





















计算 每 个 个 体 的 适应 值 
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整个 种 群 都 被 一 个 点 所 吸引 ， 粒 子 变 成 一 个 随机 扑 山 者 。 

(5) 最 大 速度 

一 般 来 说 ，V, 的 选择 不 应 超过 粒子 的 冤 度 范围 ， 如 果 TV,、 太 大 ， 粒 子 可 能 飞 过 最 优 解 
的 位 置 ， 如 果 太 小 ， 可 能 降低 粒子 的 全 局 搜索 能 力 。 

(6) 终止 条 件 

粒子 群 算法 的 终止 条 件 根 据 所 求解 的 具体 问题 ， 可 以 选择 设 定 最 大 迭代 数 或 满足 最 小 误 
差 要 求 。 

4. 带 惯 性 权重 的 粒子 群 算法 

为 了 更 好 的 控制 算法 的 探测 (exploration) 开发 (exploitation ) 能 力 ，Shi 和 Eberhart 在 
1998 年 的 下 FE 国际 进化 计算 学 术 会 议 上 发 表 了 题 为 “A Modified Particle Swarm Optimizer” 
的 论文 ， 在 基本 粒子 群 优化 算法 的 速度 更 新 公式 (9-9) 中 引入 了 惯性 权重 w， 将 式 (9-9) 
改变 为 























k+l1 k k k 天 天 
2 汪 =wo, ter] (Pia—%iy ) cars (Pod-%,) (9-11 ) 


惯性 权重 w 的 引入 使 得 PSO 算法 的 性 能 得 到 了 
很 大 提高 ， 也 使 PSO 算法 应 用 到 了 很 多 实际 问题 
中 。 在 该 算法 中 惯性 权重 w 起 着 权衡 PSO 的 全 局 寻 
优 能 力 与 局 部 寻 优 能 力 的 作用 ，w 值 较 大 ， 全 局 寻 
优 能 力 强 ， 局 部 寻 优 能 力 弱 ， 反 之 ， 则 局 部 寻 优 能 
力 增 强 ， 而 全 局 寻 优 能 力 减 弱 。 图 9-14 表明 粒子 如 
何 调整 它 的 位 置 ， 图 中 Vpbest 为 基于 pbest 的 速度 ; 
oobev 为 基于 gbest 的 速度 。 

刚 开 始 惯性 权重 为 常数 ， 但 后 来 的 实验 发 现 ， 0 一 一 一 一 一 
动态 惯性 权 值 能 够 获得 比 固定 值 更 好 的 寻 优 结果 。 图 9-14 ”粒子 调整 位 置 示意 图 
动态 惯性 权 值 可 以 在 PSO 搜索 过 程 中 线性 变化 ， 亦 
可 根据 PSO 性 能 的 某 个 测度 而 动态 改变 ， 比 如 模糊 规则 系统 等 。 目 前 ， 采用 较 多 的 惯性 权 
值 是 Shi 建议 的 线性 递减 权 值 (linearly decreasing weight，LDW) 策略 ， 将 惯性 权重 设 为 一 
个 随时 间 线 性 减少 的 函数 ， 惯 性 权重 的 函数 形式 通常 为 
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其 中 ，wii 为 初始 惯性 权 值 ，wi 为 最 终 惯性 权 值 ，K,,, 为 最 大 迭代 次 数 ; 上 为 当前 迭代 
次 数 。 这 个 函数 使 得 粒子 群 算法 在 刚 开 始 的 时 候 倾 向 于 开发 ， 然 后 逐渐 转向 于 探测 ， 从 而 在 
局 部 区 域 调 整 解 。 典 型 取 值 w=0.7，wy=0.4。 如 果 w=0， 则 粒子 速度 只 取决 于 它 当 前 
位 置 pbest 和 gbest， 速 度 本 身 没 有 记忆 。 假 设 一 个 粒子 位 于 全 局 最 好 位 置 ， 它 将 保持 静止 。 
而 其 他 粒子 则 飞 向 它 本 身 最 好 位 置 pbest 和 gbest 的 加 权 中 心 。 这 种 条 件 下 ， 镁 子 群 将 收缩 到 
当前 全 局 最 好 位 置 ， 更 像 一 个 局 部 算法 。 如 果 w>0， 则 粒子 有 扩展 搜索 空间 的 趋势 ， 从 而 针 
对 不 同 搜索 问题 ， 可 调整 算法 全 局 和 局 部 搜索 能 力 。 

5. 带 收缩 因子 的 粒子 群 算法 

Clerc 建议 采用 收缩 因子 (constriction factor) 来 保证 粒子 群 算法 收敛 ， 这 也 是 另 一 个 版 
本 的 标准 算法 。 收 缩 因子 X 是 关于 参数 cj 和 的 函数 ， 一 个 简单 的 带 收缩 因子 的 粒子 群 算法 






































《254) 





第 9 章 智能 优化 计算 《人 


k+l E kk kk 
《这 =X Lv tor (pi ia) teara peg-Xia) J 


5 ™ ..’. = 
12-p-vV8-45 | 

在 使 用 Clerc 的 收缩 因子 方法 时 ,通常 取 8 为 4.1， 从 而 收缩 因子 X=0.729。 这 相当 于 
在 速度 更 新 公式 中 ,使 前 一 次 速度 乘 0.729， 并 在 其 他 两 项 中 乘 以 0.729x2. 05 = 1. 49445 
(还 需 乘 以 0~1 之 间 的 随机 数 ) 。 对 于 Clerc 设计 的 收缩 因子 法 ， 不 再 需要 设置 最 大 速度 限 
制 ， 但 是 ， 后 来 研究 发 现 设 定 最 大 速度 限制 (Vi, =x,s,) 可 以 提高 算法 的 性 能 。 

式 (9-12) 中 的 参数 控制 着 种 群 的 开掘 和 开拓 人 能力。 对 于 k=1 时 ， 局 部 的 开发 能 
导致 快速 收敛 ,种群 的 行为 类 似 于 扑 山 法 。 反 之 ， 当 ~0 时 将 导致 大 量 的 探索 行为 ， 致 使 
收敛 很 慢 。 通 常 被 赋予 一 个 固定 值 ， 但 是 更 好 的 选择 可 以 使 初始 时 期 赋予 一 个 较 大 的 值 以 
利于 种 群 的 探索 ， 而 在 后 期 逐步 降低 至 一 个 较 小 的 值 以 集中 于 开发 。 例 如 初始 化 k=1 逐步 
降低 至 0。 

收缩 因子 法 和 惯性 权重 法 同样 有 效 ， 从 数学 上 分 析 二 者 是 等 价 的 。 两 种 方法 都 是 以 平衡 
开掘 -开拓 的 矛盾 为 目标 ， 并 以 此 改进 算法 ， 获 得 更 快 的 收敛 速度 和 更 精确 的 解 。 较 小 的 w 
和 净值 加 强 了 开发 而 抑制 开掘 ， 反 之 则 增强 开掘 性 ， 但 提高 了 获得 精确 解 的 难度 。 


9. 8.2 粒子 群 优化 算法 的 拓扑 结构 


种 群 的 拓扑 结构 对 PSO 算法 性 能 有 很 大 的 影响 。 邻 域 结 构 的 首要 目的 是 通过 阻止 信息 
在 网 络 中 的 流动 来 保持 种 群 多 样 性 ， 它 可 控制 算法 的 开掘 和 开拓 能 力 。 每 个 粒子 的 行为 受 其 
局 部 邻 域 影响 ， 这 个 局 部 邻 域 可 视 为 种 群 拓扑 结构 中 的 单个 区 域 ， 故 拓扑 结构 通过 定义 粒子 
的 邻 域 来 影响 低级 搜索 。 同 时 ， 通 过 定义 不 同 的 局 部 邻 域 之 间 的 关系 来 影响 高 级 搜索 。PSO 
中 ， 在 同一 邻 域内 的 粒子 通过 交换 自己 的 成 功 经 验 信息 来 相互 交流 ， 所 有 粒子 都 会 或 多 或 少 
的 朝 着 它 认 为 更 好 的 位 置 移动 ， 所 以 PSO 的 性 能 非常 依赖 于 拓扑 网 络 的 结构 。 

对 于 一 个 高 度 连接 的 拓扑 网 络 来 说 ， 多 数 的 个 体 都 可 以 相互 交流 ， 导 致 已 发 现 的 最 优 信 
息 可 以 快速 地 传 遍 网 络 。 从 最 优化 的 角度 来 看 ， 意 味 着 这 种 网 络 比 连接 较 少 的 网 络 能 更 快 的 
收敛 于 一 个 解 ， 但 是 高 度 连 接 的 网 络 结构 快速 收敛 的 代价 则 是 容易 陷入 局 部 最 优 值 ， 这 主要 
是 因为 高 度 连接 的 网 络 中 粒子 对 于 搜索 空间 的 覆盖 程度 不 如 较 少 连接 的 网 络 结构 。 对 于 稀 玻 
连接 的 网 络 来 说 ， 如 果 在 一 个 领域 中 存在 大 量 聚 类 ， 也 会 导致 粒子 对 于 搜索 空间 履 盖 度 的 不 
足 ， 从 而 不 能 有 效 地 找到 最 优 解 ， 因 为 在 一 个 非常 紧 的 邻 域内 的 每 个 聚 类 都 只 能 覆盖 搜索 空 
间 中 的 一 个 小 部 分 。 

目前 研究 较 多 的 拓扑 结构 主要 有 : 

1) 星 形 (star) : 亦 称 全 局 (gbest) ， 如 图 9-15a 所 示 ， 其 中 所 有 粒子 都 相互 连接 ， 
并 可 以 互相 交流 ， 即 整个 种 群 都 为 个 体 的 邻居 。 使 用 这 种 结构 的 PSO 其 收敛 速度 比 具 有 
其 他 网 络 结构 的 PSO 更 快 ， 但 也 更 容易 陷 人 局 部 最 优 ， 所 以 这 种 星 形 结构 更 适合 求解 单 
峰 问题 。 

2) 环形 (ring) : 亦 称 局 部 (lbest) ， 如 图 9-15b 所 示 ， 其 中 每 个 粒子 只 与 直接 邻居 进 
行 交 流 ， 即 种 群 列 队 的 相 邻 成 员 组 成 邻居 。 每 个 粒子 系 效法 相 邻 粒子 中 最 好 的 粒子 ， 并 向 这 
个 粒子 靠近 。 环 形 结构 的 重要 特点 就 是 相 邻 粒子 相互 重 攻 ， 这 将 有 利于 相 邻 粒子 之 间 的 信息 
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f) 汉 . 诺 依 曼 


图 9-15” 儿 种 典型 的 拓扑 网 络 








交流 ， 并 最 终 使 粒子 收敛 到 一 个 唯一 的 解 。 但 是 这 种 结构 由 于 信息 在 整个 环形 网 络 中 的 传递 
速度 较 慢 ， 算 法 的 收敛 速度 会 比较 慢 ， 但 是 相对 于 星 形 结构 ， 粒 子 可 以 覆盖 更 大 部 分 的 搜索 
空间 。 因 此 这 种 环形 拓扑 结构 比 星 形 拓扑 结构 更 适合 使 用 在 解决 多 模型 问题 中 。 

3) 轮 式 (wheel) : 如 图 9-15c 所 示 ， 这 种 结构 中 的 相 邻 粒子 之 间 都 是 相互 孤立 的 ， 
中 有 一 个 粒子 为 焦点 粒子 ， 所 有 信息 的 传递 都 要 经 过 它 来 完成 。 焦 点 粒子 对 所 有 粒子 的 性 
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做 出 比较 ， 然 后 朝 着 它 最 好 的 邻居 移动 。 如 果 焦 点 粒子 的 新 位 置 导 致 了 更 好 的 性 能 ， 则 这 个 
改进 信息 将 会 传递 给 相 邻 的 所 有 粒子 。 轮 式 拓 扑 结构 降低 了 更 好 解 在 种 群 的 信息 传递 速度 。 
4) 金字 塔 (pyramid) : 如 图 9-15d 所 示 ， 它 形成 了 一 个 三 维 轮廓 ， 是 由 三 维 线 骨架 组 
成 的 三 角 连 接 。 
5) 四 类 (four clusters) : 如 图 9-1$e 所 示 ， 结 构 中 存在 4 个 聚 类 ， 聚 类 内 部 相互 完全 连 
接 且 连接 较 少 ， 聚 类 之 内 的 每 个 粒子 都 有 5 个 邻居 。 
6) 汉 . 诺 依 曼 (Von Nermann ) : 如 图 9-15f 所 示 ， 所 有 粒子 形成 一 个 四 方 网 格 ， 顶点 
相连 形成 环 面 。 冯 : 诺 依 坚 拓 扑 结 构 被 应 用 在 很 多 经 验 学 习 问 题 中 ， 并 展现 了 更 好 的 性 能 。 
尽管 人 们 研究 和 使 用 了 多 种 拓扑 结构 ， 但 是 每 种 结构 都 有 自己 的 适用 范围 ， 没 有 一 种 结 
构 能 在 解决 所 有 的 问题 上 都 有 最 好 的 表现 。 在 解决 具体 问题 的 时 候 ， 要 根据 问题 的 特征 来 选 
择 适 合 的 拓扑 结构 。 


9.9 鱼 群 算法 简介 


人 工 鱼 和 群 优化 算法 (Artificial Fish School Algorithm, AFSA) 是 受 鱼 群 行为 的 启发 ， 新 近 
提出 的 一 种 智能 优化 算法 。 该 算法 具有 良好 的 克服 局 部 极 值 ， 取 得 全 局 极 值 的 能 力 ， 而 且 该 
算法 具有 一 些 遗 传 算法 和 粒子 群 算法 不 具备 的 特点 ， 如 使 用 灵活 ， 收 敛 速度 快 。 

鱼 群 算法 主要 是 利用 了 鱼 的 更 食 ， 聚 群 和 追尾 行为 ， 从 构造 单条 鱼 的 底层 行为 做 起 ， 通 
过 鱼 群 中 各 个 体 的 局 部 寻 优 ， 从 而 达到 全 局 寻 优 的 目的 。 

设 向 量 和 =(x ，x ，…，x) 表示 人 工 鱼 当前 的 状态 ; 目标 函数 值 Y=f(X) 表示 人 工 
鱼 当 前 状态 的 食物 浓度 ; di = Distance (X,, X;) 表示 人 工 鱼 X, 和 人 工 鱼 XX 之 间 的 距离 ; 
Visual 和 6 分 别 表 示人 工 鱼 的 视野 范围 和 拥挤 度 因子 ，trynumber 表示 人 工 鱼 每 次 疯 食 时 最 大 
的 试探 次 数 。 算 法 描述 如 下 : 

1) 疯 食 行为 (Prey) 设 人 工 鱼 当前 状态 为 和 ， 在 其 视野 范围 内 ( 即 di < Visual) 随机 
选择 一 个 状态 艺 ， 如 果 六 >Y;， 则 向 该 方向 前 进一步 ; 反之， 再 重新 选择 状态 艺 ， 判 断 是 理 
满足 前 进 条 件 ; 反复 ttynumber 后 ， 如 果 仍 不 满足 前 进 条 件 ， 则 随机 移动 一 步 。 

2) 聚 群 行为 (Swarm) 设 人 工 鱼 当前 状态 为 X,， 探索 其 视野 范围 内 ( 即 d; < Visual) 
伙伴 的 数目 nx， 如 果 nf 对 0， 按 下 式 探索 可 感知 的 伙伴 的 中 心 位 置 X.: 

X=Center(X|,X,,:…,Xy)= Most( x ,5 ms ,Xi ) 

其 中 Most 算 子 表示 取 可 感知 的 伙伴 中 多 数 共有 的 位 置 元 素 。 计 算 该 中 心 位 置 的 食物 浓 
度 Y.， 如 果 Y./nf>6Y;， 表 明 伙 伴 中 心 的 附近 有 较 多 的 食物 并 且 不 太 拥 挤 ， 则 执行 式 
(9-13) ， 和 否则 执行 艳 食 行为 。 如 果 wf= 0， 也 执行 更 食 行为 。 

X,=X。 (9-13) 

3) 追尾 行为 (Follow) 设 人 人工 鱼 当 前 状态 为 X,， 探 索 其 视野 范围 内 ( 即 di < Visual) 
伙伴 的 数目 zx， 如 果 nf 关 0， 则 探索 当前 可 感知 的 伙伴 中 状态 最 优 的 伙伴 X,,、。 如 果 了 /nf 
>6Y,;， 表 明 伙 伴 XX,,, 的 附近 有 和 较 多 的 食物 并 且 不 太 拥 挤 ， 则 执行 式 (9-14) ， 否 则 执行 现 食 
行为 。 如 果 nf=0， 也 执行 欧 食 行为 。 







































































X= Xax (9-14) 
4) 行为 的 选择 根据 所 要 解决 问题 的 性 质 ， 对 人 工 鱼 当 前 所 处 的 环境 进行 评价 ， 从 而 选 
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择 一 种 合适 的 行为 。 可 以 按照 进步 最 快 的 原则 或 者 进步 即 可 的 原则 进行 选择 ， 如 先 执 行 追尾 
行为 ， 如 果 没 有 进步 再 执行 砚 食 行为 ， 如 果 还 没有 进步 则 执行 聚 群 行 为 ， 如 果 依 然 没 有 进步 
就 执行 随机 选择 的 行为 。 这 里 显示 了 鱼 群 算法 的 灵活 性 。 

从 上 面 的 介绍 可 以 看 出 ， 鱼 群 算法 的 吏 食 行为 类 似 遗 传 算法 中 的 变异 操作 ， 聚 群 和 追尾 
行为 类 似 遗 传 算法 中 的 选择 操作 ， 其 中 聚 群 行为 也 有 潜在 的 变异 操作 。 


9.10 混合 优化 计算 方法 简介 


前 述 各 种 优化 算法 都 按照 各 自 的 机 制 实现 优化 问题 的 求解 。 由 于 所 用 机 制 不 同 ， 不 同 的 
优化 算法 具有 不 同 的 寻 优 策略 。 为 了 进一步 提高 算法 的 寻 优 性 能 ， 人 们 经 常 将 两 种 或 两 种 以 
上 的 优化 思想 结合 起 来 使 用 ， 从 而 产生 混合 优化 策略 。 例 如 第 7 章 中 的 暂 态 混沌 神经 网 络 就 
可 看 作 是 Hopfield 网 络 的 梯度 寻 优 与 混沌 优化 以 及 退火 思想 相 结合 得 到 的 混沌 优化 算法 。 各 
种 算法 结合 的 方式 多 种 多 样 ， 只 要 算法 思想 结合 得 恰当 、 有 机 ， 通 常 都 可 使 所 得 到 的 混合 优 
化 算法 同时 兼 有 多 种 优化 算法 的 优点 ， 从 而 对 寻 优 性 能 起 到 较 大 的 改善 。 下 面 介 绍 两 种 简单 
的 混合 优化 算法 的 思想 。 

1. 混沌 蚁 群 优 化 算法 

针对 函数 优化 问题 ， 将 搜索 空间 分 成 若干 个 子 区 域 。 利 用 混沌 序列 产生 才干 个 测试 点 遍 
历 在 整个 搜索 空间 ， 作 为 初始 蚁 群 位 置 ， 初 始 蚁 群 根据 各 区 域内 的 局 部 最 优 值 确定 各 区 域 的 
初始 信息 素 ， 然 后 利用 混沌 系统 产生 大 量 测试 点 作为 工作 有 蚊 群 ， 工 作 尽 群 根据 不 同 区 域内 的 
言 息 素 的 含量 ， 随 机 地 选择 不 同 的 区 域 进行 混沌 搜索 ， 根 据 搜索 到 的 各 区 域内 的 新 的 局 部 最 
优 值 ， 不 断 更 新 各 区 域内 的 信息 素 含量 ， 信 息 素 含量 越 大 的 区 域 ， 混 沌 搜索 的 概率 越 大 ， 也 
就 越 容易 寻 得 更 优 和解， 从 而 信息 素 的 含量 就 会 进一步 提高 ， 这 正 是 蚁 群 算法 信息 素 正 反馈 的 
思想 。 将 这 种 思想 与 混沌 搜索 相 结 合 ， 最 后 利用 工作 蚁 群 不 断 地 混沌 搜索 找到 寻 优 函数 的 全 
局 最 优 解 。 

2. 蚁 群 鱼 群 混合 优化 算法 

疏 群 算法 和 鱼 群 算法 都 属于 种 群 优 化 算法 。 他 们 的 共同 特点 是 ， 对 于 单个 个 体 而 言 
(蚂蚁 或 人 工 鱼 ) 不 存在 智能 行为 ， 只 是 遵循 某 种 规律 而 运动 。 但 当 个 体 数量 达到 一 定 程度 
时 ， 整 个 种 群 将 会 表现 出 某 种 智能 行为 。 蚁 群 算法 是 利用 信息 素 正 反馈 的 原理 寻 得 最 优 路 
径 。 人 工 鱼 则 按照 “进步 最 快 的 原则 ”或 者 “进步 即 可 的 原则 ”从 吏 食 、 聚 群 和 追尾 三 种 
行为 选择 一 个 合适 的 行为 ， 最 终 实 现 寻 优 。 

在 两 种 算法 中 ， 由 于 个 体 运 动 的 目的 不 同 ， 因 此 个 体 运动 的 规律 也 有 所 区 别 。 曙 蚁 寻找 
食物 的 目的 是 要 将 食物 运 回 业 人 穴 ， 因 此 即使 某 路 径 上 蚂蚁 数量 很 多 ， 但 如 该 路 径 上 食物 丰 
寅 ， 则 其 他 蚂蚁 也 要 集结 到 该 路 径 上 来 尽快 将 食物 运 回 梨 。 因 此 归 尽 的 运动 方向 不 应 受 拥 挤 
度 的 限制 。 而 鱼 寻找 到 食物 后 即 吃 掉 食物 ， 如 果 该 处 食物 虽 多 ， 但 鱼 的 数量 也 很 多 ， 则 人 工 
鱼 到 达 该 处 后 ， 食 物 可 能 也 已 经 被 其 他 个 体 吃 光 了 ， 所 以 拥挤 度 在 决定 个 体 运 动 方向 时 起 着 
关键 的 作用 。 

由 此 可 见 ， 拥 挤 度 是 否 在 优化 过 程 中 起 作用 是 这 两 种 算法 的 核心 区 别 。 也 就 是 说 ， 鱼 群 
算法 相当 于 在 蚁 群 算法 中 引入 了 拥挤 度 的 概念 ， 并 且 拥 挤 度 在 算法 的 寻 优 过 程 中 始终 起 作 
用 。 拥 挤 度 的 引入 ， 在 算法 的 初期 ， 可 以 避免 算法 的 个 体 过 早 地 集结 到 信息 素 高 的 路 径 上 
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来 ， 从 而 可 避免 算法 出 现 早熟 的 现象 ， 提 高 算法 的 全 局 寻 优 能 力 。 但 在 算法 后 期 ， 拥 挤 度 将 
会 对 算法 的 收敛 性 以 及 收敛 速度 造成 影响 ， 例 如 ， 人 工 鱼 最 终 不 能 够 全 部 集结 到 最 优 值 周 
围 。 也 就 是 说 ， 拥 挤 度 在 寻 优 初期 可 改善 算法 的 寻 优 性 能 ， 在 寻 优 后 期 则 对 寻 优 性 能 产生 一 
定 的 负面 影响 。 

这 样 ， 针 对 组 合 优化 问题 ， 可 结合 鱼 群 算法 和 蚁 群 算法 两 者 优点 ， 提 出 一 种 新 的 混合 优 
化 算法 。 在 蚁 群 算法 的 初期 ， 引 入 鱼 群 算法 拥挤 度 的 概念 ， 限 制 收 群 算法 过 早 收敛， 防止 早 
熟 现 象 的 出 现 ， 从 而 增强 算法 遍历 寻 优 能 力 。 随 着 迭代 次 数 的 增加 ， 逐 渐 衰 减 拥挤 度 的 作 
用 ， 最 后 算法 演变 为 传统 的 蚁 群 算法 ， 路 径 选择 的 概率 与 拥挤 度 无 关 ， 完 全 由 信息 素 的 浓度 
以 及 启发 信息 来 决定 。 蚂 蚁 更 容易 选择 信息 素 浓度 高 且 距 离 短 的 路 径 ， 从 而 保证 算法 能 够 快 
速 地 收敛 到 最 优 解 上 。 

目前 ， 各 种 高 效 的 寻 优 算法 不 断 涌现 出 来 ， 而 当 一 种 新 的 优化 算法 提出 之 后 ， 很 快 就 会 
出 现 各 种 改进 算法 (或 混合 优化 算法 ) 。 这 些 改进 算法 的 提出 对 原始 算法 的 理论 完善 和 实际 
应 用 都 起 着 积极 的 促进 作用 ， 为 智能 优化 计算 的 发 展 提供 了 源源 不 断 的 动力 。 


习题 


















































. 哪些 工程 问题 能 够 转化 为 优化 计算 问题 进行 求解 ? 
. 模拟 退火 的 含义 是 什么 ? 
遗传 算法 有 哪些 关键 操作 ? 
蚁 群 算法 的 工作 原理 是 什么 ? 

. 简 述 粒子 群 优化 算法 的 工作 机 理 。 
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随 着 计算 机 技术 、 网 络 技术 以 及 信息 技术 的 发 展 ， 智 能 体 技术 得 到 了 广泛 应 用 。 同 时 ， 
由 于 所 要 解决 问题 的 复杂 程度 不 断 提高 ， 单 一 智能 体 有 时 无 法 完成 任务 的 独立 求解 ， 这 时 就 
需要 多 个 智能 体 协作 完成 ， 从 而 促进 了 多 智能 体 技术 的 发 展 。 多 智能 体 不 但 具有 自身 求解 问 
题 的 能 力 和 行为 目标 ， 而 且 能 够 相互 协作 ， 达 到 共同 的 整体 目标 ， 特 别 有 利 于 大 规模 复杂 问 
题 的 求解 。 

多 智能 体系 统 (Multi-Agent System，MAS) 是 分 布 式 人 工 智 能 的 一 个 重要 分 文 ， 是 20 
世纪 末 至 21 世纪 初 国际 上 人 工 智 能 的 前 沿 学 科 。 人 研究 的 目的 在 于 解决 大 型 、 复 杂 的 现实 问 
题 ， 而 解决 这 类 问题 已 超出 了 单个 智能 体 的 能 

多 智能 体系 统 把 经 典 的 博弈 论 和 分 散 控 制 等 理论 与 计算 机 科学 和 机 器 学 习 等 现代 技术 相 
结合 ， 形 成 了 一 个 不 断 扩 展 的 领域 。 

本 章节 简要 介绍 有 关 多 智能 体系 统 理论 基础 、 多 智能 体系 统 的 特征 、 多 智能 体系 统 的 协 
作 等 内 容 。 


10.1 智能 体 的 概念 与 结构 






























































10. 1. 1 智能 体 的 概念 


在 人 工 智 能 领域 中 ， 智 能 体 (Agent) 既 可 以 是 一 个 实体 ， 也 可 以 是 一 个 程序 。 一 般 处 
于 一 定 的 环境 中 ， 利 用 自身 传感器 来 感知 环境 信息 ， 通 过 执行 器 对 环境 进行 影响 。 其 作用 过 
程 可 描述 为 图 10-1 所 示 。 传感器 

现代 人 工 智能 的 研究 大 多 可 以 看 作 是 以 单一 智 
能 体 为 研究 对 象 的 。 单 一 智能 体 可 以 感知 环境 信 个 时 和 和 认 
息 ， 并 通过 执行 器 影响 环境 ， 例 如 ， 一 个 人 就 可 以 图 10.1 智能 体 与 环境 的 交互 作用 
看 作 是 一 个 智能 体 ， 其 中 眼睛 、 耳 人 条 等 感官 可 看 作 
传感器 ， 手 、 脚 等 肢体 可 看 作 执行 器 。 一 个 机 器 人 也 可 以 看 作 一 个 智能 体 ， 其 利用 自身 所 带 
有 的 摄像 头 、 雷 达 等 传感器 感知 环境 信息 ， 车 轮 及 关节 电机 等 作为 执行 器 完成 任务 。 智 能 软 
件 可 看 作 由 图 形 用 户 界 面 作为 传感器 和 执行 器 的 智能 体 。 从 这 个 角度 看 ， 人 工 智能 可 以 被 看 
作 是 关于 智能 体 的 原理 和 设计 的 研究 。 

通常 ， 智 能 体 作 为 独立 的 智能 实体 一 般 具 有 以 下 特征 : 

(1) 自主 性 ”一 个 智能 体 应 该 拥有 独立 的 知识 和 处 理 知识 的 方法 ， 能 够 根据 自身 的 内 
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部 状态 或 感知 到 的 环境 信息 自主 决策 ， 实 现状 态 和 行为 的 控制 ， 并 能 够 响应 环境 的 要 求 和 


变化 。 

(2) 反应 性 ”智能 体 应 能 够 完成 所 有 的 目标 ， 主 动感 知 和 影响 环境 ， 通 过 采取 主动 行 
为 ， 改 变 自身 状态 或 环境 状态 ， 实 现 自身 目标 。 

(3) 社会 性 “智能 体 有 时 并 不 是 孤立 存在 的 ， 而 是 由 多 个 智能 体形 成 一 个 社会 种 群 。 
此 时 ， 智 能 体 不 但 能 够 自主 独立 运行 ， 还 应 具有 与 环境 中 其 他 智能 体 相互 协作 的 能 力 ， 对 各 
种 冲突 和 矛盾 能 够 通过 协商 的 方式 进行 解决 。 

(4) 进化 性 ”智能 体 在 运行 过 程 中 ， 应 具有 适应 环境 、 自 主 学 习 、 自 主 进化 的 能 
能 够 通过 不 断 扩充 知识 ， 提 高 系统 整体 运行 的 可 靠 性 和 智能 性 。 

根据 智能 体 的 工作 环境 可 将 其 分 
为 软件 智能 体 、 硬 件 智能 体 和 人 工 智 《人 Mi 能 从 
能 体 等 几 种 类 型 。 

软件 智能 体 技术 是 人 工 智能 与 网 
络 技术 相 结合 的 产物 ， 软 件 智能 1 
“生存 ”在 计算 机 操作 系统 、 数 据 库 
及 网 络 等 环境 中 。 软 件 智能 体 与 计算 < 
机 程序 有 一 定 的 区 别 ， 即 所 有 的 软件 图 10-2 软件 智能 体 的 分 类 
智能 体 都 是 程序 ， 但 并 非 所 有 程序 都 
是 软件 智能 体 ， 只 有 具有 智能 体 基本 特征 的 程序 才能 称 为 软件 智能 体 。 软 件 智能 体 的 分 类 如 
图 10-2 所 示 。 

硬件 智能 体 通常 可 看 作 各 类 机 器 人 。 

而 人 工 生命 智能 休 则 是 “生存 ”在 各 类 人 造 环境 中 的 虚拟 生命 体 ， 例 如 前 面 介绍 的 
“人 工 蚂蚁 ” “人工 佳 ”等 概念。 


10. 1.2 智能 体 的 结构 
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智能 体能 够 接收 传感器 的 信息 输入 ， 并 运行 智能 体 程序 ， 根 据 执行 结果 ， 利 用 执行 器 进 
行 相应 的 行为 或 动作 。 智 能 体 的 程 | 

序 实现 智能 体 从 感知 到 动作 的 映射， 

因此 ， 智 能 体 程序 需要 在 计算 机 设 “| 

备 上 运行 。 这 样 ， 简 单 的 智能 体 结 

构 可 以 只 是 一 台 计 算 机 ， 而 复杂 的 
智能 体 结构 可 能 还 包括 隔离 纯 硬件 “| 

和 智能 体 程序 的 软件 平台 。 因 此 ， 1 | 
智能 体 、 体 系 结构 和 程序 之 间 的 关 
系 可 看 作 : 智能 体 = 体系 结构 + 

程序 。 图 10-3 反应 式 智能 体 结构 图 





单个 智能 体 的 结构 按 属性 可 分 
为 反应 式 体系 结构 、 慎 思 式 体系 结构 和 复合 式 体系 结构 三 种 类 型 。 
(1) 反应 式 智能 体 反应 式 智能 体 的 结构 图 如 图 10-3 所 示 。 
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反应 式 智能 体 的 内 部 具有 预先 设 定 的 知识 规则 ， 利 用 IF-THEN 式 的 规则 将 智 

知 信息 和 动作 关联 起 来 ， 当 智能 体感 知 到 的 外 界 信息 或 环境 变化 符合 某 一 条 件 时 ， 

需 迎 辑 表 示 和 推理 ， 直 接 调 用 预 置 的 知识 规则 ， 及 时 作出 快速 响应 。 一 般 认 为 反应 式 智能 { 

的 智能 程度 较 低 ， 缺 乏 灵活 性 ， 通 常 仅 适用 于 执行 简单 任务 的 实时 环境 中 。 
(2) 慎 思 式 智 能 体 慎 思 式 智能 体 的 结构 图 如 图 10-4 所 示 。 






































图 10-4 ” 慎 思 式 智能 体 结构 图 
慎 思 式 智 能 体 利 用 传感器 感知 外 部 环境 信息 











， 根 据 内 部 状态 进行 信息 融合 ， 产 生 修改 当 
前 状态 的 描述 ， 在 知识 库 的 支持 下 制定 规划 ， 再 在 目标 引导 下 形成 动作 序列 ， 利 用 执行 器 对 
外 部 环境 进行 作用 。 











能 体 中 的 环境 模型 一 般 要 求 是 已 知 的 ， 因 此 ， 慎 思 式 智能 体 无 法 工作 在 未 知 环 
境 中 ， 而 且 ， 慎 思 式 智能 体 执行 效率 较 低 ， 不 能 对 环境 的 变化 做 出 快速 反应 。 
(3) 复合 式 智能 体 ”复合 式 智能 体 的 结构 图 如 图 10-5 所 示 。 








与 反应 式 智能 体 相 比 ， 慎 思 式 智能 体能 够 实现 逻辑 推理 ， 具 有 较 高 的 智能 化 程度 。 不 
过 ,， 慎 思 式 智 外 





























复合 式 智能 体 综合 了 反应 式 智能 体 和 慎 思 式 智 能 体 二 者 的 优点 ， 既 具有 快速 响应 性 能 ， 
又 具有 较 强 的 灵活 性 。 复 合式 智能 体 通过 传感器 感知 外 部 环境 信息 ， 根 据 所 感知 的 外 部 信息 
的 性 质 ， 做 出 不 同 的 决策 处 理 。 对 于 简单 和 紧急 情况 ， 智 能 体 直 接 通 过 反射 模块 给 出 动作 命 
令 ， 并 由 执行 咒 完 成 相应 响应 。 如 果 是 一 般 情 况 ， 则 利用 符号 表示 和 推力 系统 给 出 命令 决 


策 ， 由 执行 器 完成 相应 动作 。 复 合式 智能 体 可 以 与 其 他 智能 体 进 行 通信 ， 通 过 协商 的 方式 共 
同 完成 目标 任务 。 
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10.2 多 智能 体系 统 


在 许多 实际 应 用 中 ， 智 能 体 并 不 是 独立 工作 的 单一 系统 ， 而 是 多 个 智能 体 之 间 以 不 同 的 
方式 共存 、 相 互通 信 、 共 同 工 作 。 例 如 ， 因 特 网 上 的 软件 智能 体 、 足 球 机 器 人 智能 体 等 。 这 
种 由 一 组 可 能 相互 作用 的 智能 体 组 成 的 系统 称 为 多 智能 体系 统 (MAS) ， 例 如 ， 图 10-6 展示 
的 是 机 器 人 足球 队 组 成 的 多 智能 体系 统 。 研 究 多 智能 体系 统 的 人 工 智能 子 领 域 称 为 分 布 式 人 


工 智能 。 





图 10-6 机 器 人 足球 队 组 成 的 多 智能 体系 统 


10. 2. 1 多 智能 体系 统 的 特征 


多 智能 体系 统 与 单一 智能 体系 统 不 同 ， 它 具有 自身 独 有 的 特征 ， 接 下 来 ， 将 从 以 下 几 个 
角度 来 对 多 智能 体系 统 的 特征 进行 前 述 。 

1. 智能 体 的 设计 

通常 情况 下 ， 构 成 多 智能 体系 统 的 各 种 智能 体 都 是 以 不 同 的 方式 进行 设计 的 。 不 同 的 设 
计 可 能 涉及 不 同 的 硬件 ， 例 如 足球 机 器 人 可 以 采用 不 同 的 机 械 平 台 进 行 设计 ， 而 软件 智能 体 
则 有 不 同 的 运行 代码 。 基 于 不 同 硬件 或 实现 不 同行 为 的 智能 体 通常 称 为 异 构 智能 体 ， 而 采用 
同样 的 设计 方式 并 具有 同样 行为 能 力 的 智能 体 称 为 同 构 智 能 体 。 智 能 体 之 间 的 差异 可 能 会 对 
智能 体 各 方面 的 功能 和 决策 都 产生 不 同 的 影响 。 

2. 环境 

智能 体 必须 处 理 静 态 或 动态 (随时 间 变 化 ) 的 环境 信息 。 大 多 数 针对 单个 智能 体 的 人 
工 智能 技术 都 是 在 静态 环境 下 开发 的 ， 因 为 静态 环境 信息 更 容易 处 理 。 而 在 多 智能 体系 统 
中 ,不 同 的 智能 体 从 各 自 的 角度 来 感知 外 部 环境 ， 这 就 导致 外 部 环境 呈现 动态 差异 特性 。 这 
对 系统 的 开发 会 产生 严重 影响 ， 例 如 ， 在 并 发 学 习 多 智能 体系 统 中 ， 可 以 观察 到 智能 体 的 不 
稳定 行为 。 另 外 ， 一 个 动态 环境 中 各 部 分 信息 应 该 由 哪些 智能 体 来 感知 和 处 理 也 是 一 个 关键 
性 的 研究 内 容 。 

3. 感知 

多 智能 体系 统 中 ， 智 能 体 的 信息 感知 通常 是 分 布 式 的 ， 也 就 是 说 ， 多 智能 体系 统 中 ， 不 
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同 的 智能 体 因 位置 不 同 、 时 间 差 异 等 原因 ， 可 能 观察 到 不 同 的 感知 数据 或 不 同 的 事物 ， 每 个 
智能 体 对 外 界 世 界 的 感知 可 能 是 片面 的 ， 这 有 可 能 直接 影响 智能 体 的 决策 过 程 。 例 如 ， 在 部 
分 可 观测 条 件 下 的 多 智能 体 最 优 规划 问题 就 是 一 个 比较 复杂 的 问题 。 为 此 ， 多 智能 体 需 要 研 
究 如 何 将 感知 信息 进行 优化 组 合 ， 以 增强 智能 体系 统 对 当前 状态 的 信息 感知 。 

4. 控制 

与 单 智能 体系 统 不 同 ， 多 智能 体系 统 的 控制 通常 是 分 散 的 。 这 意味 着 每 个 智能 体 的 决策 
在 很 大 程度 上 取决 于 智能 体 本 身 。 分 散 式 控制 由 于 具有 良好 的 鲁 棒 性 和 容错 性 的 特点 ， 因 此 
比 集中 控制 具有 更 好 的 性 能 。 不 过 ， 多 智能 体 协 议 的 分 发 有 时 会 存在 一 定 困 难 ， 这 对 多 智能 
体系 统 的 控制 会 产生 一 定 影响 。 多 智能 体 的 决策 涉及 博弈 论 的 内 容 。 在 合作 型 或 者 团队 型 多 
智能 体系 统 的 控制 中 ， 智 能 体 之 间 可 以 实现 利益 共享 、 分 布 式 决策 以 及 异步 计算 ， 其 缺点 是 
需要 为 此 设计 专业 的 协同 机 制 。 

5. 知识 

在 单 智能 体系 统 中 ， 通 常 假设 智能 体 知 道 自己 的 行为 ， 但 不 一 定 知道 它 的 行为 如 何 影响 
环境 。 在 多 智能 体系 统 中 ， 每 个 智能 体 对 当前 环境 状态 的 知识 认 知 水 平 可 能 有 很 大 差异 。 例 
如 ， 在 一 个 包含 两 个 同 构 智能 体 的 协同 系统 中 ， 每 个 智能 体 可 以 获知 另 一 个 智能 体 的 可 用 动 
作 集 ， 两 个 智能 体 可 以 知道 (通过 通信 ) 它们 当前 的 感知 信息 ， 或 者 根据 某 些 共享 的 先 验 
知识 推断 彼此 的 意图 。 另 外 ， 一 个 智能 体 有 时 可 以 观察 对 手 的 多 智能 体系 统 ， 但 通常 不 知道 
对 手 的 行动 集 和 当前 感知 信息 ， 因 此 无 法 推断 出 他 们 的 动作 规划 。 一 般 来 说 ， 在 多 智能 体系 
统 中 ， 每 个 智能 体 在 决策 时 还 必须 考虑 对 方 智能 体 的 知识 情况 。 

6. 通信 

交互 通常 与 某 种 形式 的 通信 相关 联 ， 通 常 认 为 一 个 多 智能 体系 统 中 的 通信 是 一 个 双向 的 
过 程 ， 所 有 的 智能 体 都 可 能 是 消息 的 发 送 者 和 接收 者 。 通 信 可 以 在 不 同情 况 下 使 用 ， 例 如 ， 
合作 型 智能 体 之 间 的 协调 。 另 外 ， 为 了 使 交换 的 信息 安全 并 及 时 地 送 达 ， 必 须 使 用 网 络 协 
议 ， 即 智能 体 之 间 必 须 说 特定 的 语言 才能 相互 理解 ， 特 别 是 异 构 智 能 体 之 间 更 是 如 此 。 


10.2.2 多 智能 体系 统 的 类 型 


多 智能 体 主要 包括 BDI 模型 、 协 商 模型 、 协 作 规划 模型 以 及 自 协调 模型 等 几 种 常见 模 
型 ， 适 用 于 不 同 的 应 用 环境 中 。 

1，BDI 模型 

BDI 模型 是 一 个 概念 和 逻辑 上 的 理论 模型 ， 一 般 包 含 三 种 基本 成 分 ， 即 信念 ( Belief)、 
愿望 (Desire) 和 意图 (Intention)。 信 念 是 一 个 包括 了 对 世界 相关 的 信念 、 与 其 他 智能 体 思 
维 趋向 相关 的 信念 和 自我 信念 的 集合 。 信 和 念 是 智能 体 对 世界 的 认 知 ， 包 含 描述 环境 特性 的 数 
据 和 描述 自身 功能 的 数据 ， 是 主体 智能 体 进行 思维 活动 的 基础 。 愿 望 是 智能 体 的 最 初 动机 ， 
是 希望 达到 的 状态 或 希望 保持 的 状态 的 集合 。 智 能 体 可 以 拥有 互 不 相 容 的 愿望 ， 而 且 也 不 需 
要 相信 它 的 愿望 是 绝对 可 以 实现 的 。 意 图 是 从 承诺 实现 的 愿望 中 选取 的 当前 最 需要 完成 或 者 
最 适合 完成 的 一 个 愿望 ， 是 当前 智能 体 正 在 实现 的 目标 。 

2. 协商 模型 

各 个 智能 体 的 行动 目标 是 为 了 追求 自身 效用 的 最 大 化 ， 但 在 多 智能 体系 统 中 ， 为 了 完成 
全 局 目标 ， 就 要 各 个 智能 体 建 立 一 致 的 目标 。 智 能 体 之 间 的 协作 行为 可 通过 协商 产生 。 协 商 
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策略 包括 任务 分 解 、 任 务 分 配 、 任 务 监督 以 及 任务 评价 等 内 容 。 

3. 协作 规划 模型 

多 智能 体系 统 的 协作 规划 模型 主要 用 于 制定 协调 一 致 的 问题 规划 。 各 个 智能 体 都 独立 求 
解 目标 、 考 虑 其 他 智能 体 的 行为 约束 ， 并 进行 独立 规划 。 智 能 体 的 相互 作用 以 通信 规划 和 目 
标的 形式 抽象 表达 ， 通 过 相互 告知 、 调 节 自 丑 局 部 规划 ， 最 终 达 到 共同 目标 。 

4. 自 协调 模型 

自 协调 模型 是 建立 在 开放 和 动态 环境 下 的 多 智能 体系 统 模型 ， 模 型 具有 动态 性 ， 主 要 表 
现在 系统 自 组 织 结构 的 分 解 重组 和 多 智能 体系 统 内 部 的 自主 协调 等 方面 。 


10. 2. 3 多 智能 体系 统 的 应 用 


多 智能 体系 统 已 经 得 到 了 大 规模 的 广泛 应 用 ， 例 如 在 软件 工程 中 ， 多 智能 体 技术 被 认为 
是 一 种 新 颖 而 且 很 有 前 途 的 软件 构建 范例 。 一 个 复杂 的 软件 系统 可 以 被 看 作 是 许多 小 型 自主 
智能 体 的 集合 ， 每 个 智能 体 都 有 自己 的 功能 和 属性 ， 其 中 智能 体 之 间 的 交互 增强 了 整个 系统 
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智能 
的 完整 性 。 在 大 型 系统 中 ,使 用 多 智能 体 技术 可 带 来 以 下 优势 : 
1) 利用 异步 并 行 计算 提高 计算 速度 和 效率 。 














2) 当 一 个 或 多 个 智能 体 失 效 时 ， 多 智能 体系 统 可 以 进行 适当 调整 ， 确 保 系 统 具 有 良好 
的 鲁 棒 性 和 可 靠 性 。 


3) 新 的 智能 体能 够 加 入 到 多 智能 体系 统 中 ， 提 高 了 系统 的 灵活 性 和 可 扩展 性 。 

4) 与 整体 系统 相 比 ， 单 个 智能 体 成 本 低 ， 开 发 更 容易 ， 也 便于 重复 利用 。 

多 智能 体 技术 打破 了 目前 知识 工程 领域 仅 使 用 一 个 专家 的 限制 , 因而 可 完成 大 规模 复杂 
系统 的 作业 任务 ， 在 许多 实际 领域 中 表现 出 了 特有 的 优势 。 

1. 智能 机 器 人 

在 智能 机 器 人 中 , 信息 集成 和 协调 是 一 项 关键 性 技术 , 直接 关系 到 机 器 人 的 性 能 和 智能 
化 程度 。 一 个 智能 机 器 人 通常 包括 多 种 信息 处 理子 系统 , 如 二 维 或 三 维 视觉 处 理 、 信 息 融 
合 、 规 划 决 策 以 及 自动 驾驶 等 。 各 子 系统 是 相互 依赖 、 互 为 条 件 的 , 它们 需要 共享 信息 、 相 
互 协调 , 才能 有 效 地 完成 总 体 任务 。 

利用 多 智能 体 技术 , 将 每 个 机 器 人 作为 一 个 智能 体 , 建立 多 智能 体 机 器 人 协调 系统 ， 可 
实现 多 个 机 器 人 的 相互 协调 与 合作 , 完成 复杂 的 并 行 作业 任务 。 

RoboCup 联合 会 组 织 的 机 器 人 足球 赛 和 机 器 人 救援 比赛 中 也 应 用 到 多 智能 体 技 术 。 机 顺 
人 足球 赛 是 多 智能 体 技术 应 用 的 典型 代表 。 机 器 人 足球 赛 由 自主 机 器 人 组 成 的 团队 进行 比 
赛 。 机 器 人 足球 赛 提 供 了 一 个 测试 多 智能 系统 算法 的 实验 平台 。 该 平台 能 够 模拟 许多 真实 世 
界 的 特征 信息 ， 例 如， 连续 动态 的 场地 ， 对 手 的 行为 的 不 可 预测 性 ， 传 感 信 号 的 不 确定 性 
等 。 机 器 人 救援 比赛 也 是 多 智能 体 技术 应 用 的 典型 案例 ， 在 机 器 人 救援 中 ， 机 器 人 团队 需要 
探索 未 知 的 环境 ， 才 能 发 现 受害 者 或 扑灭 火灾 等 。 

2. 智能 交通 控制 

交通 控制 拓扑 结构 具有 分 布 式 的 特性 ， 因 此 很 适合 应 用 多 智能 体 技术 。 在 处 理 交 通 事故 
等 剧烈 变化 的 交通 情况 时 ， 多 智能 体 的 分 布 式 处 理 和 协调 技术 能 够 表现 出 良好 的 应 用 效果 。 
此 外 ， 多 智能 体 技术 已 经 广泛 应 用 于 汽车 联运 系统 、 行 驶 路 径 规划 、 飞 行 交通 控制 、 铁 路 交 
通 控 制 、 海 洋 交通 控制 等 众多 领域 中 。 
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3 人 工 智 能 技术 





3. 柔性 制造 

多 智能 体 技术 可 表示 制造 系统 , 并 为 解决 动态 问题 的 复杂 性 和 不 确定 性 提供 新 的 思路 。 
如 在 制造 系统 中 , 各 加 工 单元 可 看 作 智能 体 , 从 而 使 加 工 过 程 构成 一 个 半 自 治 的 多 智能 体制 
造 系统 , 完成 单元 内 加 工 任务 的 监督 和 控制 。 多 智能 体 技 术 既 可 用 于 制造 系统 的 调度 ， 又 可 
用 于 制造 过 程 中 的 分 布 式 控制 。 

4. 协调 专家 系统 

对 于 复杂 的 问题 , 采用 单一 的 专家 系统 往往 不 能 满足 求解 要 求 , 需要 利用 多 个 专家 系统 
协作 , 共同 解决 问题 。 利 用 多 智能 体 技术 , 可 实现 多 专家 系统 的 协调 求解 。 

5. 分 布 式 预 测 、 监 控 及 诊断 

智能 体 具 有 意图 的 性 质 , 利用 多 智能 体 的 联合 意图 机 制 可 实现 联合 行动 , 从 而 实现 分 布 




















式 预测 与 监控 。 
6. 分 布 式 智能 决策 
利用 多 智能 体 技术 所 具有 的 特性 可 解决 复杂 系统 的 决策 问题 。 例 如 ,采用 智能 体 技术 将 











多 个 专家 系统 的 决策 方法 有 机 地 协调 起 来 ， 可 建立 基于 多 智能 体 协调 的 决策 支持 系统 。 

7. 软件 开发 

利用 计算 机 来 开发 多 智能 体系 统 , 称 为 软件 智能 体 。 软 件 工程 的 研究 从 模型 角度 考察 知 
能 体 ， 认 为 面向 智能 体 的 软件 开发 方法 是 为 更 确切 地 描述 复杂 并 发 系统 的 行为 而 采用 的 一 种 
抽象 的 描述 形式 , 是 观察 客观 世界 和 解决 问题 的 一 种 方法 。 

8. 虚拟 现实 

虚拟 现实 定义 为 使 用 户 不 同 程度 地 投入 一 个 人 工 环境 , 并 能 与 该 环境 中 的 对 象 进行 相互 
作用 的 仿真 技术 。 这 项 研究 是 以 人 为 中 心 的 人 机 和 谐 系 统 。 例 如 ， 采 用 虚拟 智能 体 技 术 可 建 
立 电子 市 场 的 模拟 系统 ， 从 而 可 实现 电子 市 场 中 的 货物 储藏 和 买卖 机 制 以 及 银行 信贷 和 金融 
管理 机 制 。 

9. 操作 系统 

VAXAVMS 操作 系统 就 是 采用 拟人 化 的 具有 自学 习 能 力 的 人 机 智能 体 技术 设计 实现 的 。 
利用 智能 体 所 具有 的 特性 可 实现 操作 系统 的 自 适 应 功能 。 人 机 智能 体 技术 可 通过 接受 用 户 的 
反馈 使 操作 系统 适应 用 户 的 兴趣 和 习惯 , 通过 识别 正确 与 错误 的 命令 及 与 其 他 智能 体 进行 网 
络 通信 实现 系统 的 学 习 , 从 而 使 操作 系统 在 复杂 环境 下 实现 与 用 户 的 交互 。 

10. 网 络 自动 化 与 智能 

多 智能 体 技术 的 一 个 非常 具有 挑战 性 的 应 用 领域 是 互联 网 。 如 今 ， 互 联网 已 经 发 展 成 为 
一 个 高 度 分 布 式 的 开放 系统 ， 异 构 软 件 智能 体 可 以 在 互联 网 上 很 好 地 运行 。 但 在 “智能 体 
层 ”( 高 于 TCP/IP 层 ) 上 的 协议 或 语言 技术 还 不 成 熟 ， 网 络 本 吴 的 结构 也 在 不 断 变 化 。 在 
这 样 的 环境 中 ， 多 智能 体 技术 可 以 用 来 开发 替代 用 户 的 智能 体 ， 并 能 够 与 其 他 智能 体 进行 协 
商谈 判 。 例 如 ， 电 子 商务 和 电子 拍卖 就 是 这 样 的 应 用 案例 。 多 智能 体 技术 还 可 用 于 分 布 式 数 
据 挖 掘 和 信息 检索 等 领域 。 

利用 多 智能 体 一 致 性 的 组 织 、 表 示 、 通 信 等 特点 , 通过 定义 不 同类 别 的 智能 体 , 可 构成 
网 络 的 不 同 智能 成 员 。 例 如 ， 网 络 单元 智能 体 、 管 理 对 象 智能 体 以 及 操作 系统 智能 体 等 ,从 
而 实现 网 络 管理 。 

智能 体 技术 具有 在 Internet 上 的 协调 功能 , 通过 采用 Unix 命令 可 实现 用 户 在 Intemet 上 


《266 












































第 10 章 智能 体 与 多 智能 体系 统 《6 


广泛 的 协调 。 将 智能 体 技术 与 Internet 技术 相 结合 , 建立 基于 客户 / 服务 器 的 智能 体 结构 , 可 
实现 用 WWW 开发 计算 机 支持 的 协同 工作 。 

软件 智能 体 是 指 活动 于 软件 环境 中 的 智能 体 ， 它 通过 下 达 命令 和 分 析 环 境 反馈 同 环境 进 
行 交互 。 利 用 软件 智能 体 技术 ,可 对 Intemet 这 一 规模 庞大 、 极 度 异 质 、 高 度 动态 的 软件 环 
境 实现 信息 的 收集 、 检 索 、 分 析 、 综 合 , 从 而 实现 高 度 智能 行为 的 信息 处 理 手 段 。 

11. 分 式 布 计算 

分 布 式 计算 成 为 影响 计算 机 技术 发 展 的 关键 技术 ,其 目标 是 实现 分 散 对 等 的 协同 计算 。 
多 智能 体 技术 为 实现 这 种 方法 提供 了 新 的 途径 , 基于 智能 体 的 计算 是 下 一 代 软 件 开发 的 突 
破 口 





























12. 产品 设计 
目前 , 利用 智能 体 技术 来 构造 设计 系统 已 成 为 一 个 新 的 研究 热点 。 设 计 间 题 涉及 多 目标 
的 约束 求解 和 设计 过 程 的 协调 。 例 如 ， 超 大 规模 集成 电路 的 设计 就 需要 有 关 电 路 、 逻 辑 门 、 
寄存 器 、 指 令 集 、 结 构 以 及 装配 技术 等 方面 的 知识 。 为 了 降低 设计 的 耗费 , 提高 设计 的 速 
度 , 利用 多 智能 体系 统 的 并 行 处 理 技术 将 不 同 的 任务 分 解 , 可 分 别 分 布 在 不 同 的 智能 体 上 。 
智能 体 由 代理 助手 服务 器 、 智 能 体 服务 器 、 布 线 智能 体 服务 需 和 数据 库 服 务 器 构成 ， 每 类 智 
能 体 服务 器 分 别 对 超大 规模 集成 电路 的 某 一 部 分 进行 设计 , 完成 不 同 的 设计 功能 , 通过 代理 
助手 服务 器 实现 服务 器 与 客户 的 协调 通信 。 利 用 客户 /服务 器 技术 可 实现 设计 过 程 的 网 络 协 
同化 。 通 过 建立 公用 黑板 结构 实现 各 智能 体 间 的 协调 机 制 , 得 到 全 局 一 致 的 解 。 























可 将 移动 智能 体 应 用 于 物流 管理 ， 利 用 移动 智能 体 可 实现 网 络 化 的 物资 购买 与 出 售 之 间 





14. 网 络 化 的 办 公 自 动 化 

人 可 作为 一 类 智能 体 存 在 于 多 智能 体系 统 中 。 采 用 多 智能 体 技术 可 实现 办 公 自 动 化 系统 
的 人 机 一 体 化 , 系统 中 各 个 智能 体 可 分 别 实现 信息 的 采集 、 存 储 、 交 换 、 加 工 和 决策 。 

15. 网 络 化 计算 机 辅助 教学 及 医疗 

采用 人 机 智能 体 技术 可 建立 各 类 培训 系统 ， 用 于 人 机 交互 的 窗口 , 实现 了 人 机 对 话 。 每 
个 用 户 都 可 有 各 自 的 人 机 智能 体 , 各 智能 体 通过 网 络 实现 通信 。 

此 外 ， 多 智能 体 技术 在 传感器 网 络 、 社 会 科学 、 人 工 生 命 、 计 算 机 游戏 、 系 统 控制 等 诸 
多 领域 也 得 到 了 广泛 应 用 。 















































习 题 
1. 智能 体 一 般 具有 哪些 特征 ? 
2. 单个 智能 体 的 结构 按 属性 可 分 为 哪些 类 型 ? 
3. 多 智能 体 主要 有 哪 几 种 常见 模型 ? 
4. 多 智能 体 技术 有 哪些 应 用 领域 ? 
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